UNIVERSIDAD GRAN MARISCAL DE AYACUCHO
ESCUELA DE ADMINISTRACIOgraveN
CATEDRA ESTADISTICA
SEDE EL TIGRE
VARIABLE ALEATORIA
DOCENTE HAMLET MATA MATA
PARTICIPANTE JENIFER TELIS
ELTIGRE ANZOAgraveTEGUI
INTRODUCCIOacuteN
A menudo se presenta la necesidad de calcular el nuacutemero de maneras
distintas en que un suceso se presenta o puede ser realizado Otras veces es
importante determinar la probabilidad de ocurrencia de un evento especiacutefico En
ambos casos se apela al sentido comuacuten o se establecen meacutetodos que permitan
sistematizar tales caacutelculos Con frecuencia el sentido comuacuten ayuda a entender por
queacute se eligioacute un procedimiento dado mientras que la formalizacioacuten del caacutelculo las
viacuteas para encontrar las soluciones apropiadas
A la hora de contrastar nuestra hipoacutetesis nula de partida varios factores
van a determinar la prueba estadiacutestica que utilizaremos y se refieren al nuacutemero
tipo y distribucioacuten de las variables y a la forma en que se eligioacute el estudio
La matemaacutetica nacioacute de la necesidad de contar y ordenar disentildear modelos
eficientes en un medio cada vez maacutes complejo y simplificar una variedad
inmensa de informacioacuten es el drama de nuestro tiempo
Con la realizacioacuten de este trabajo pudimos conocer la importancia de la
Estadiacutestica en todos los campo que componen la sociedad tambieacuten pudimos
conocer que es un valor esperado variables aleatorias como se dividen
distribucioacuten simeacutetrica distribucioacuten sesgada distribucioacuten de probabilidad y su
uso distribucioacuten discreta definicioacuten caracteriacutesticas ejemplo distribucioacuten
Bernoulli Exponencial Multinomial Uniforme Binomial y Binomial negativa
Poisson Geomeacutetrica Hipergeometrica y Zeta Tambieacuten pudimos conocer sobre
la Teoriacutea combinatoria Variacioacuten y la Combinacioacuten
PRUEBAS PARAMEacuteTRICAS
Porque comparan los grupos a traveacutes de una medida de tendencia central
(paraacutemetro) la media aritmeacutetica Como vemos este valor adquiere una vital
importancia
Mientras que las pruebas que suponen una distribucioacuten de probabilidad
determinada para los datos se denominan pruebas parameacutetricas
Dentro de las pruebas parameacutetricas las maacutes habituales se basan en la
distribucioacuten de probabilidad normal y al estimar los paraacutemetros del modelo se
supone que los datos constituyen una muestra aleatoria de esa distribucioacuten por lo
que la eleccioacuten del estimador y el caacutelculo de la precisioacuten de la estimacioacuten
elementos baacutesicos para construir intervalos de confianza y contrastar hipoacutetesis
dependen del modelo probabiliacutestico supuesto
Cuando un procedimiento estadiacutestico es poco sensible a alteraciones en el
modelo probabiliacutestico supuesto es decir que los resultados obtenidos son
aproximadamente vaacutelidos cuando eacuteste variacutea se dice que es un procedimiento
robusto
Las inferencias en cuanto a las medias son en general robustas por lo que
si el tamantildeo de muestra es grande los intervalos de confianza y contrastes
basados en la t de Student son aproximadamente vaacutelidos con independencia de la
verdadera distribucioacuten de probabilidad de los datos pero si eacutesta distribucioacuten no es
normal los resultados de la estimacioacuten seraacuten poco precisos
iquestEn queacute condiciones la media es realmente un valor representativo de una serie de
datos Como sabemos existen otras medidas de tendencia central que seguacuten la
distribucioacuten de los datos pueden llegar a ser maacutes representativas Cuando los
datos siguen una distribucioacuten normal la media actuacutea como una buena medida
resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten
Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es
acampanada y simeacutetrica alrededor de la media
Recordemos que por ejemplo si se cumplen los supuestos de
normalidad (fig 1)
El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las
observaciones
El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las
observaciones
El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el
997
Conocidas la micro y la se puede reconstruir la distribucioacuten de las
observaciones
La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar
Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando
el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la
segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)
Como vemos estas dos variables siguen diferentes patrones aunque tienen en
comuacuten el mismo valor de la media (fig 2)
iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que
los datos de las variables a comparar se distribuyen de igual forma pero que entre
ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay
un valor igual pero incrementado en un valor constante (K) al que podriacuteamos
llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no
habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los
valores a comparar Cuanto maacutes se aleje del valor 0
mayores seraacuten las diferencias
Obseacutervese la importancia de asumir que este valor de desplazamiento de
una muestra a la otra es constante Si estamos comparando dos diferentes
tratamientos por ejemplo un placebo y un principio activo en dos muestras que
son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al
principio activo en cada caso la diferencia entre medias representa no el efecto
promedio sino el efecto del tratamiento en cada caso Si por el contrario este
efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas
Fig 1
Fig 2
Fig 3
Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para
muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se
toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las
pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las
muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se
trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de
varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea
comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por
alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las
poblaciones y en el de que sus varianzas son iguales
En las pruebas en las que se tienen menos supuestos es en las de muestra
grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o
poblaciones eran normales estas pruebas se dice que son robustas porque no es
necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es
robusta no es necesario correr el riesgo de estar equivocados en las conclusiones
en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas
que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las
que se tienen menos supuestos
PRUEBAS NO PARAMEacuteTRICAS
Se denominan pruebas no parameacutetricas aquellas que no presuponen una
distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de
distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados
estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y
recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos
con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la
normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para
corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en
la normal
Cuando se analizan datos medidos por una variable cuantitativa continua
las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de
probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta
suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no
resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos
disponemos de dos posibles mecanismos los datos se pueden transformar de tal
manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas
estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de
probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan
pruebas no parameacutetricas (distribution free)
La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas
acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos
suponer que las poblaciones tienen maacutes o menos la forma de distribuciones
normales o que se conocen sus varianzas o se sabe que son iguales o bien que las
muestras son independientes Como hay muchos casos donde no se pueden
cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas
basadas en suposiciones menos estrictas que se han dado a conocer como
ldquoPruebas no parametricasrdquo
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
INTRODUCCIOacuteN
A menudo se presenta la necesidad de calcular el nuacutemero de maneras
distintas en que un suceso se presenta o puede ser realizado Otras veces es
importante determinar la probabilidad de ocurrencia de un evento especiacutefico En
ambos casos se apela al sentido comuacuten o se establecen meacutetodos que permitan
sistematizar tales caacutelculos Con frecuencia el sentido comuacuten ayuda a entender por
queacute se eligioacute un procedimiento dado mientras que la formalizacioacuten del caacutelculo las
viacuteas para encontrar las soluciones apropiadas
A la hora de contrastar nuestra hipoacutetesis nula de partida varios factores
van a determinar la prueba estadiacutestica que utilizaremos y se refieren al nuacutemero
tipo y distribucioacuten de las variables y a la forma en que se eligioacute el estudio
La matemaacutetica nacioacute de la necesidad de contar y ordenar disentildear modelos
eficientes en un medio cada vez maacutes complejo y simplificar una variedad
inmensa de informacioacuten es el drama de nuestro tiempo
Con la realizacioacuten de este trabajo pudimos conocer la importancia de la
Estadiacutestica en todos los campo que componen la sociedad tambieacuten pudimos
conocer que es un valor esperado variables aleatorias como se dividen
distribucioacuten simeacutetrica distribucioacuten sesgada distribucioacuten de probabilidad y su
uso distribucioacuten discreta definicioacuten caracteriacutesticas ejemplo distribucioacuten
Bernoulli Exponencial Multinomial Uniforme Binomial y Binomial negativa
Poisson Geomeacutetrica Hipergeometrica y Zeta Tambieacuten pudimos conocer sobre
la Teoriacutea combinatoria Variacioacuten y la Combinacioacuten
PRUEBAS PARAMEacuteTRICAS
Porque comparan los grupos a traveacutes de una medida de tendencia central
(paraacutemetro) la media aritmeacutetica Como vemos este valor adquiere una vital
importancia
Mientras que las pruebas que suponen una distribucioacuten de probabilidad
determinada para los datos se denominan pruebas parameacutetricas
Dentro de las pruebas parameacutetricas las maacutes habituales se basan en la
distribucioacuten de probabilidad normal y al estimar los paraacutemetros del modelo se
supone que los datos constituyen una muestra aleatoria de esa distribucioacuten por lo
que la eleccioacuten del estimador y el caacutelculo de la precisioacuten de la estimacioacuten
elementos baacutesicos para construir intervalos de confianza y contrastar hipoacutetesis
dependen del modelo probabiliacutestico supuesto
Cuando un procedimiento estadiacutestico es poco sensible a alteraciones en el
modelo probabiliacutestico supuesto es decir que los resultados obtenidos son
aproximadamente vaacutelidos cuando eacuteste variacutea se dice que es un procedimiento
robusto
Las inferencias en cuanto a las medias son en general robustas por lo que
si el tamantildeo de muestra es grande los intervalos de confianza y contrastes
basados en la t de Student son aproximadamente vaacutelidos con independencia de la
verdadera distribucioacuten de probabilidad de los datos pero si eacutesta distribucioacuten no es
normal los resultados de la estimacioacuten seraacuten poco precisos
iquestEn queacute condiciones la media es realmente un valor representativo de una serie de
datos Como sabemos existen otras medidas de tendencia central que seguacuten la
distribucioacuten de los datos pueden llegar a ser maacutes representativas Cuando los
datos siguen una distribucioacuten normal la media actuacutea como una buena medida
resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten
Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es
acampanada y simeacutetrica alrededor de la media
Recordemos que por ejemplo si se cumplen los supuestos de
normalidad (fig 1)
El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las
observaciones
El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las
observaciones
El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el
997
Conocidas la micro y la se puede reconstruir la distribucioacuten de las
observaciones
La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar
Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando
el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la
segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)
Como vemos estas dos variables siguen diferentes patrones aunque tienen en
comuacuten el mismo valor de la media (fig 2)
iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que
los datos de las variables a comparar se distribuyen de igual forma pero que entre
ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay
un valor igual pero incrementado en un valor constante (K) al que podriacuteamos
llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no
habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los
valores a comparar Cuanto maacutes se aleje del valor 0
mayores seraacuten las diferencias
Obseacutervese la importancia de asumir que este valor de desplazamiento de
una muestra a la otra es constante Si estamos comparando dos diferentes
tratamientos por ejemplo un placebo y un principio activo en dos muestras que
son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al
principio activo en cada caso la diferencia entre medias representa no el efecto
promedio sino el efecto del tratamiento en cada caso Si por el contrario este
efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas
Fig 1
Fig 2
Fig 3
Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para
muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se
toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las
pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las
muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se
trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de
varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea
comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por
alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las
poblaciones y en el de que sus varianzas son iguales
En las pruebas en las que se tienen menos supuestos es en las de muestra
grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o
poblaciones eran normales estas pruebas se dice que son robustas porque no es
necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es
robusta no es necesario correr el riesgo de estar equivocados en las conclusiones
en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas
que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las
que se tienen menos supuestos
PRUEBAS NO PARAMEacuteTRICAS
Se denominan pruebas no parameacutetricas aquellas que no presuponen una
distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de
distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados
estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y
recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos
con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la
normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para
corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en
la normal
Cuando se analizan datos medidos por una variable cuantitativa continua
las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de
probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta
suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no
resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos
disponemos de dos posibles mecanismos los datos se pueden transformar de tal
manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas
estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de
probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan
pruebas no parameacutetricas (distribution free)
La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas
acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos
suponer que las poblaciones tienen maacutes o menos la forma de distribuciones
normales o que se conocen sus varianzas o se sabe que son iguales o bien que las
muestras son independientes Como hay muchos casos donde no se pueden
cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas
basadas en suposiciones menos estrictas que se han dado a conocer como
ldquoPruebas no parametricasrdquo
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
PRUEBAS PARAMEacuteTRICAS
Porque comparan los grupos a traveacutes de una medida de tendencia central
(paraacutemetro) la media aritmeacutetica Como vemos este valor adquiere una vital
importancia
Mientras que las pruebas que suponen una distribucioacuten de probabilidad
determinada para los datos se denominan pruebas parameacutetricas
Dentro de las pruebas parameacutetricas las maacutes habituales se basan en la
distribucioacuten de probabilidad normal y al estimar los paraacutemetros del modelo se
supone que los datos constituyen una muestra aleatoria de esa distribucioacuten por lo
que la eleccioacuten del estimador y el caacutelculo de la precisioacuten de la estimacioacuten
elementos baacutesicos para construir intervalos de confianza y contrastar hipoacutetesis
dependen del modelo probabiliacutestico supuesto
Cuando un procedimiento estadiacutestico es poco sensible a alteraciones en el
modelo probabiliacutestico supuesto es decir que los resultados obtenidos son
aproximadamente vaacutelidos cuando eacuteste variacutea se dice que es un procedimiento
robusto
Las inferencias en cuanto a las medias son en general robustas por lo que
si el tamantildeo de muestra es grande los intervalos de confianza y contrastes
basados en la t de Student son aproximadamente vaacutelidos con independencia de la
verdadera distribucioacuten de probabilidad de los datos pero si eacutesta distribucioacuten no es
normal los resultados de la estimacioacuten seraacuten poco precisos
iquestEn queacute condiciones la media es realmente un valor representativo de una serie de
datos Como sabemos existen otras medidas de tendencia central que seguacuten la
distribucioacuten de los datos pueden llegar a ser maacutes representativas Cuando los
datos siguen una distribucioacuten normal la media actuacutea como una buena medida
resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten
Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es
acampanada y simeacutetrica alrededor de la media
Recordemos que por ejemplo si se cumplen los supuestos de
normalidad (fig 1)
El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las
observaciones
El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las
observaciones
El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el
997
Conocidas la micro y la se puede reconstruir la distribucioacuten de las
observaciones
La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar
Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando
el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la
segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)
Como vemos estas dos variables siguen diferentes patrones aunque tienen en
comuacuten el mismo valor de la media (fig 2)
iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que
los datos de las variables a comparar se distribuyen de igual forma pero que entre
ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay
un valor igual pero incrementado en un valor constante (K) al que podriacuteamos
llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no
habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los
valores a comparar Cuanto maacutes se aleje del valor 0
mayores seraacuten las diferencias
Obseacutervese la importancia de asumir que este valor de desplazamiento de
una muestra a la otra es constante Si estamos comparando dos diferentes
tratamientos por ejemplo un placebo y un principio activo en dos muestras que
son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al
principio activo en cada caso la diferencia entre medias representa no el efecto
promedio sino el efecto del tratamiento en cada caso Si por el contrario este
efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas
Fig 1
Fig 2
Fig 3
Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para
muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se
toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las
pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las
muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se
trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de
varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea
comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por
alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las
poblaciones y en el de que sus varianzas son iguales
En las pruebas en las que se tienen menos supuestos es en las de muestra
grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o
poblaciones eran normales estas pruebas se dice que son robustas porque no es
necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es
robusta no es necesario correr el riesgo de estar equivocados en las conclusiones
en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas
que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las
que se tienen menos supuestos
PRUEBAS NO PARAMEacuteTRICAS
Se denominan pruebas no parameacutetricas aquellas que no presuponen una
distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de
distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados
estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y
recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos
con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la
normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para
corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en
la normal
Cuando se analizan datos medidos por una variable cuantitativa continua
las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de
probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta
suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no
resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos
disponemos de dos posibles mecanismos los datos se pueden transformar de tal
manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas
estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de
probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan
pruebas no parameacutetricas (distribution free)
La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas
acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos
suponer que las poblaciones tienen maacutes o menos la forma de distribuciones
normales o que se conocen sus varianzas o se sabe que son iguales o bien que las
muestras son independientes Como hay muchos casos donde no se pueden
cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas
basadas en suposiciones menos estrictas que se han dado a conocer como
ldquoPruebas no parametricasrdquo
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
datos siguen una distribucioacuten normal la media actuacutea como una buena medida
resumen Recordemos algunas de las caracteriacutesticas de esta distribucioacuten
Viene determinada por dos paraacutemetros la media (micro) y la desviacioacuten tiacutepica () Es
acampanada y simeacutetrica alrededor de la media
Recordemos que por ejemplo si se cumplen los supuestos de
normalidad (fig 1)
El valor de la micro plusmn 1 incluiraacute aproximadamente el 683 central de las
observaciones
El valor de la micro plusmn 2 incluiraacute aproximadamente el 953 central de las
observaciones
El valor de la micro plusmn 3 incluiraacute praacutecticamente todas las observaciones el
997
Conocidas la micro y la se puede reconstruir la distribucioacuten de las
observaciones
La igualdad de variancias es el otro gran obstaacuteculo que deberemos salvar
Dos distribuciones pueden tener el mismo valor en el paraacutemetro media mostrando
el primer valor cercano a la media (poca dispersioacuten variancia pequentildea) y la
segunda valores alejados de dicho paraacutemetro (maacutes dispersioacuten gran variancia)
Como vemos estas dos variables siguen diferentes patrones aunque tienen en
comuacuten el mismo valor de la media (fig 2)
iquestPor queacute tienen estas asunciones Las pruebas parameacutetricas asumen que
los datos de las variables a comparar se distribuyen de igual forma pero que entre
ellos existe un desplazamiento fijo es decir para cada valor de una muestra hay
un valor igual pero incrementado en un valor constante (K) al que podriacuteamos
llamar desplazamiento (fig 3) Si este valor constante se acerca al valor 0 no
habriacutea diferencias entre los grupos ya que existiriacutea un solapamiento entre los
valores a comparar Cuanto maacutes se aleje del valor 0
mayores seraacuten las diferencias
Obseacutervese la importancia de asumir que este valor de desplazamiento de
una muestra a la otra es constante Si estamos comparando dos diferentes
tratamientos por ejemplo un placebo y un principio activo en dos muestras que
son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al
principio activo en cada caso la diferencia entre medias representa no el efecto
promedio sino el efecto del tratamiento en cada caso Si por el contrario este
efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas
Fig 1
Fig 2
Fig 3
Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para
muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se
toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las
pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las
muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se
trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de
varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea
comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por
alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las
poblaciones y en el de que sus varianzas son iguales
En las pruebas en las que se tienen menos supuestos es en las de muestra
grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o
poblaciones eran normales estas pruebas se dice que son robustas porque no es
necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es
robusta no es necesario correr el riesgo de estar equivocados en las conclusiones
en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas
que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las
que se tienen menos supuestos
PRUEBAS NO PARAMEacuteTRICAS
Se denominan pruebas no parameacutetricas aquellas que no presuponen una
distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de
distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados
estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y
recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos
con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la
normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para
corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en
la normal
Cuando se analizan datos medidos por una variable cuantitativa continua
las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de
probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta
suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no
resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos
disponemos de dos posibles mecanismos los datos se pueden transformar de tal
manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas
estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de
probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan
pruebas no parameacutetricas (distribution free)
La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas
acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos
suponer que las poblaciones tienen maacutes o menos la forma de distribuciones
normales o que se conocen sus varianzas o se sabe que son iguales o bien que las
muestras son independientes Como hay muchos casos donde no se pueden
cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas
basadas en suposiciones menos estrictas que se han dado a conocer como
ldquoPruebas no parametricasrdquo
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
Obseacutervese la importancia de asumir que este valor de desplazamiento de
una muestra a la otra es constante Si estamos comparando dos diferentes
tratamientos por ejemplo un placebo y un principio activo en dos muestras que
son homogeacuteneas basalmente este valor K seraacute el efecto que podremos imputar al
principio activo en cada caso la diferencia entre medias representa no el efecto
promedio sino el efecto del tratamiento en cada caso Si por el contrario este
efecto no fuera constante ya no se cumpliriacutean los supuestos de estas pruebas
Fig 1
Fig 2
Fig 3
Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para
muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se
toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las
pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las
muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se
trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de
varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea
comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por
alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las
poblaciones y en el de que sus varianzas son iguales
En las pruebas en las que se tienen menos supuestos es en las de muestra
grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o
poblaciones eran normales estas pruebas se dice que son robustas porque no es
necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es
robusta no es necesario correr el riesgo de estar equivocados en las conclusiones
en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas
que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las
que se tienen menos supuestos
PRUEBAS NO PARAMEacuteTRICAS
Se denominan pruebas no parameacutetricas aquellas que no presuponen una
distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de
distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados
estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y
recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos
con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la
normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para
corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en
la normal
Cuando se analizan datos medidos por una variable cuantitativa continua
las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de
probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta
suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no
resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos
disponemos de dos posibles mecanismos los datos se pueden transformar de tal
manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas
estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de
probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan
pruebas no parameacutetricas (distribution free)
La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas
acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos
suponer que las poblaciones tienen maacutes o menos la forma de distribuciones
normales o que se conocen sus varianzas o se sabe que son iguales o bien que las
muestras son independientes Como hay muchos casos donde no se pueden
cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas
basadas en suposiciones menos estrictas que se han dado a conocer como
ldquoPruebas no parametricasrdquo
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
Fig 3
Dentro de las pruebas parameacutetricas se tienen para muestras grandes y para
muestras pequentildeas Un supuesto que se aplica a ambas es que la muestra que se
toma debe haber sido seleccionada en forma aleatoria o probabiliacutestica En las
pruebas parameacutetricas de muestra pequentildea se requiere el supuesto de que las
muestras fueron extraiacutedas de una poblacioacuten con distribucioacuten normal y cuando se
trata de dos o maacutes muestras tambieacuten se requiere una prueba de igualdad de
varianzas Existen pruebas estadiacutesticas por medio de las cuales se podriacutea
comprobar esto sin embargo suele no daacutersele importancia a esto y se pasa por
alto El anaacutelisis de varianza tambieacuten se basa en el supuesto de normalidad de las
poblaciones y en el de que sus varianzas son iguales
En las pruebas en las que se tienen menos supuestos es en las de muestra
grande las cuales se pueden aplicar sin saber o comprobar si la poblacioacuten o
poblaciones eran normales estas pruebas se dice que son robustas porque no es
necesario que se cumpla dicho supuesto Cuando la prueba que se requiere no es
robusta no es necesario correr el riesgo de estar equivocados en las conclusiones
en ellos En cambio se dispone de muchas pruebas estadiacutesticas no parameacutetricas
que tienen una aplicacioacuten semejante a las parameacutetricas de muestra pequentildea en las
que se tienen menos supuestos
PRUEBAS NO PARAMEacuteTRICAS
Se denominan pruebas no parameacutetricas aquellas que no presuponen una
distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de
distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados
estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y
recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos
con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la
normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para
corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en
la normal
Cuando se analizan datos medidos por una variable cuantitativa continua
las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de
probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta
suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no
resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos
disponemos de dos posibles mecanismos los datos se pueden transformar de tal
manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas
estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de
probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan
pruebas no parameacutetricas (distribution free)
La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas
acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos
suponer que las poblaciones tienen maacutes o menos la forma de distribuciones
normales o que se conocen sus varianzas o se sabe que son iguales o bien que las
muestras son independientes Como hay muchos casos donde no se pueden
cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas
basadas en suposiciones menos estrictas que se han dado a conocer como
ldquoPruebas no parametricasrdquo
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
PRUEBAS NO PARAMEacuteTRICAS
Se denominan pruebas no parameacutetricas aquellas que no presuponen una
distribucioacuten de probabilidad para los datos por ello se conocen tambieacuten como de
distribucioacuten libre (distribution free) En la mayor parte de ellas los resultados
estadiacutesticos se derivan uacutenicamente a partir de procedimientos de ordenacioacuten y
recuento por lo que su base loacutegica es de faacutecil comprensioacuten Cuando trabajamos
con muestras pequentildeas (n lt 10) en las que se desconoce si es vaacutelido suponer la
normalidad de los datos conviene utilizar pruebas no parameacutetricas al menos para
corroborar los resultados obtenidos a partir de la utilizacioacuten de la teoriacutea basada en
la normal
Cuando se analizan datos medidos por una variable cuantitativa continua
las pruebas estadiacutesticas de estimacioacuten y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucioacuten de
probabilidad de tipo normal o de Gauss Pero en muchas ocasiones esta
suposicioacuten no resulta vaacutelida y en otras la sospecha de que no sea adecuada no
resulta faacutecil de comprobar por tratarse de muestras pequentildeas En estos casos
disponemos de dos posibles mecanismos los datos se pueden transformar de tal
manera que sigan una distribucioacuten normal o bien se puede acudir a pruebas
estadiacutesticas que no se basan en ninguna suposicioacuten en cuanto a la distribucioacuten de
probabilidad a partir de la que fueron obtenidos los datos y por ello se denominan
pruebas no parameacutetricas (distribution free)
La mayoriacutea de las pruebas de hipoacutetesis requieren suposiciones especiacuteficas
acerca de la poblacioacuten o poblaciones que se muestran En muchos casos debemos
suponer que las poblaciones tienen maacutes o menos la forma de distribuciones
normales o que se conocen sus varianzas o se sabe que son iguales o bien que las
muestras son independientes Como hay muchos casos donde no se pueden
cumplir estas suposiciones los estadiacutesticos han generado teacutecnicas alternativas
basadas en suposiciones menos estrictas que se han dado a conocer como
ldquoPruebas no parametricasrdquo
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
En estos casos se emplea como paraacutemetro de centralizacioacuten la mediana
que es aquel punto para el que el valor de X estaacute el 50 de las veces por debajo y
el 50 por encima
Propiedades
1 No se relacionan con el estudio de un paraacutemetro de la poblacioacuten
Por lo general cuando se hace referencia a pruebas no parameacutetricas se puede estar
hablando tanto de las no parameacutetricas como de las libres de distribucioacuten
(distribution free tests)
Las dos indicaciones maacutes importantes que se deben tener en cuenta para utilizar
una prueba no parameacutetrica son que
1 la distribucioacuten de la poblacioacuten no sea normal
2 la escala de medicioacuten de la variable en cuestioacuten sea categoacuterica
Los meacutetodos no parameacutetricos son menos poderosos que los parameacutetricos Esto
quiere decir que es maacutes difiacutecil rechazar la hipoacutetesis nula con las pruebas no
parameacutetricas
Por esa razoacuten los estadiacutesticos por lo general recurren a los meacutetodos no
parameacutetricos soacutelo cuando los datos no cumplen con los supuestos parameacutetricos
Sin embargo hay problemas de investigacioacuten en los que las variables categoacutericas
son las indicadas y por lo tanto soacutelo un meacutetodo no parameacutetrico es el indicado Los
pasos en las pruebas de hipoacutetesis no parameacutetricas son los mismos de las
parameacutetricas Los cambios por lo general se limitan a cambios en la foacutermula para
obtener el valor observado y en la tabla que se utiliza Pero se habla de hipoacutetesis
nula nivel de significacioacuten error tipo I y tipo II etc
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
El uso de meacutetodos no parametricos ofrece numerosas ventajas
1 los meacutetodos no parametricos se pueden usar con todo tipos de datos
ndash informacioacuten cualitativa (de escala nominal) informacioacuten en forma de rangos
(escala ordinal) asiacute como informacioacuten medida de un modo mas exacto (escala de
intervalo o de razoacuten)
2 por lo general son faacuteciles de aplicar y raacutepidos de calcular con
tamantildeos pequentildeos de muestra En ocasiones son tan sencillos que basta contar
con la frecuencia con que algunas caracteriacutesticas aparecen en los datos Por lo
tanto a menudo se usan para estudios piloto o preliminares yo en situaciones en
que se desean respuestas raacutepidas
3 hacen menos premisas menos estrictas (mas faacuteciles de cumplir) que
los procedimientos claacutesicos por lo tanto gozan de mayor aplicabilidad y
proporcionan un conjunto de conclusiones mas generales de base mas amplia
4 permiten solucionar problemas que no implican pruebas de
paraacutemetros de poblacioacuten
5 son mas econoacutemicos que los procedimientos claacutesicos ya que el
investigador puede aumentar la potencia y a pesar de ello ahorrar dinero tiempo y
trabajo al recopilar muestras de datos mayores medibles con mas aproximacioacuten
lo que soluciona con mayor rapidez el problema
6 seguacuten el procedimiento seleccionado los meacutetodos no parametricos
pueden ser tan poderosos (o casi tanto) como el procesamiento claacutesico cuando se
cumplen las premisas de este ultimo y quizaacutes sean un poco mas poderosos aun
cuando no se cumplan
Los procedimientos no parametricos tambieacuten ofrecen algunas desventajas
1 no conviene usar meacutetodos no parametricos cuando se pueden
cumplir todas las premisas de los procedimientos claacutesicos y los datos se miden en
una escala bien sea de intervalos de razones A menos de que se empleen
procedimientos claacutesicos en estos casos el investigador no esta aprovechando por
completo los datos Se pierde informacioacuten al convertir datos recopilados (de una
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
escala de intervalo o de razoacuten) a rangos (escala ordinal) o categoriacuteas (escala
nominal) En particular en esas circunstancias algunas pruebas no parametricas
muy raacutepidas y sencillas tienen mucha menos potencia que los procedimientos
claacutesicos y por lo general se deben evitar
2 seguacuten aumenta el tamantildeo de la muestra en ocasiones el manejo
requerido de datos para los procedimientos no parametricos se hace laborioso a
menos que se disponga de un paquete de computacioacuten adecuado
3 con frecuencia se necesitan tablas especiales de valores
criacuteticos y estas no se obtienen con tanta facilidad como las tablas de los
valores criacuteticos normales t 2X y F Ccedil
Prueba de signos para una sola muestra
Salvo para las pruebas con muestra grande todas las pruebas estaacutendar
concernientes a medias estaacuten basadas en la suposicioacuten de que las poblaciones que
se muestrean tienen aproximadamente la forma de distribuciones normales
Cuando en un caso determinado esta suposicioacuten resulta insostenible la prueba
estaacutendar se puede sustituir por una de varias alternativas no parametricas entre
ellas la ldquoprueba de signosrdquo
La prueba de signos de una sola muestra se aplica cuando se muestrea una
poblacioacuten simeacutetrica continua de manera que la probabilidad de que un valor de la
muestra sea menor que la media o mayor que la media es en ambos casos frac12 Para
probar la hipoacutetesis nula ( O ) contra una hipoacutetesis alternativa apropiada con
base en una muestra aleatoria de tamantildeo n se sustituye cada valor de la muestra
mayor que O por un signo de mas y cada valor de la muestra menor que O por
un signo de menos despueacutes se aprueba la hipoacutetesis nula de que estos signos de
mas y menos son valores de una variable aleatoria que tiene distribucioacuten binomial
con 2
1p (si un valor de la muestra es igual a O simplemente lo rechazamos)
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
Prueba de suma de rangos
Se puede utilizar cuando se desea probar una hipoacutetesis relacionada a un
paraacutemetro que refleje una tendencia central Cuando no se cumplen las premisas
de la prueba t el procedimiento de Wilcoxon es probable que sea mas potente
para detectar la existencia de diferencias importantes que su contraparte
correspondiente
Para llevar a cabo la prueba de rangos y signos de Wilcoxon se puede
aplicar el siguiente procedimiento de seis pasos
1 para cada partiacutecula en una muestra de n partidas se obtiene un
resultado de diferencia Di
2 despueacutes no se toman en cuenta los signos + y ndash y se obtiene un
grupo de n diferencias absolutas iD
3 se omite de cualquier anaacutelisis adicional cualquier diferencia
absoluta con resultados de 0 con lo cual se obtiene un grupo de n resultados de
diferencias absolutas que no sean cero donde n
4 despueacutes se asignan rangos Ri desde uno hasta n a cada una de las
iD de modo que el resultado de diferencia absoluta mas pequentildeo obtiene una
clasificacioacuten de uno y el mayor de n Por la falta de precisioacuten en el proceso de
medicioacuten si dos o mas iD son iguales a cada una se asigna el ldquorango promediordquo
de los rangos que de lo contrario se les hubieran asignado individualmente si no
hubiera ocurrido la igualdad de los datos
5 ahora se asignan de nuevo el siacutembolo + o el signo ndash a cada uno de
los n rangos de Ri dependiendo de si originalmente Di era positiva o negativa
6 la prueba estadiacutestica de Wilcoxon W se obtiene como la suma de
las clasificaciones +
n
i
iRW1
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
Para muestras de n 20 se puede utilizar tablas para obtener los valores
criacuteticos de la prueba estadiacutestica W tanto para las pruebas de una cola como de dos
a diversos niveles de significacioacuten Se rechaza la hipoacutetesis nula en una prueba de
dos colas si el valor observado W es igual o excede al valor critico superior o es
igual o inferior al valor critico inferior Se rechaza la hipoacutetesis nula en una prueba
de una cola en direccioacuten positiva si el valor observado W es igual o excede el
valor critico superior Se rechaza la hipoacutetesis nula para una prueba de una cola en
direccioacuten negativa si el valor observado de w es inferior o igual al valor critico
inferior
Para nge20 la prueba estadiacutestica W tiene distribucioacuten aproximadamente
normal y se puede utilizar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis nula
W
WWZ
VARIABLES ALEATORIA Y COMO SE DIVIDEN
Una variable es aleatoria si toma diferentes valores como resultado de un
experimento aleatorio Puede ser discreta o continua Si puede tomar soacutelo un
nuacutemero limitado de valores entonces es una variable aleatoria discreta En el otro
extremo si puede tomar cualquier valor dentro de un intervalo dado entonces se
trata de una variable aleatoria continua
Se puede pensar en una variable aleatoria como un valor o una magnitud
que cambia de una presentacioacuten a otra sin seguir una secuencia predecible Los
valores de una variable aleatoria son los valores numeacutericos correspondientes a
cada posible resultado de un experimento aleatorio
La distribucioacuten de probabilidad de una variable aleatoria proporciona una
probabilidad para cada valor posible y estas probabilidades deben sumar 1
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
VALOR ESPERADO DE UNA VARIABLE ALEATORIA
El valor esperado es una idea fundamental en el estudio de las distribuciones de
probabilidad
Para obtener el valor esperado de una variable aleatoria discreta se
multiplica cada valor que la variable puede tomar por la probabilidad de
presentacioacuten de ese valor y luego se suman esos productos Es un promedio
pesado de los resultados que se esperan en el futuro El valor esperado pesa cada
resultado posible con respecto a la frecuencia con que se espera se que presente
En consecuencia las presentaciones maacutes comunes tienen asignadas un peso
mayor que las menos comunes
El valor esperado tambieacuten puede ser obtenido a partir de estimaciones
subjetivas En ese caso el valor esperado no es maacutes que la representacioacuten de las
convicciones personales acerca del resultado posible
VARIABLES ALEATORIAS DISCRETAS
Variable que toma un nuacutemero finito o infinito de valores numerables
Sean x1 x2 x3 xn los distintos valores que puede tomar la variable
aleatoria
Y p(x1) p(x2) p(xn) su probabilidad
Los pares de valores (xj p(xj)) constituyen la distribucioacuten de probabilidades de la
variable aleatoria
p(x) se denomina funcioacuten de probabilidad y debe cumplir con las siguientes
propiedades
0 lt p(xj) lt 1 (p(x) es una probabilidad y por lo tanto debe tomar valores
entre 0 y 1)
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
1)( jxP (la suma de probabilidades repartidas entre todos los valores
de la variable debe ser igual a 1)
De la misma manera que calculamos frecuencias acumuladas podemos acumular
probabilidades obteniendo la funcioacuten de distribucioacuten de probabilidades
Esta funcioacuten representa la probabilidad de que la variable aleatoria sea menor o
igual que un determinado valor
F(xj) = P (X lt xj)
Graacuteficamente la funcioacuten aumenta de a saltos ya que entre dos valores
consecutivos de una variable discreta no puede tomar valores intermedios
VARIABLES ALEATORIAS CONTINUAS
En este caso en lugar de trabajar con la probabilidad de valores
particulares de la variable resulta maacutes apropiado calcular probabilidades
asociadas a intervalos Para distribuir propiedades se usa una funcioacuten que mide
concentracioacuten de probabilidades alrededor de un punto que se denomina
funcioacuten de densidad de probabilidad (fdp) y se denota como f(x)
Una funcioacuten de densidad de probabilidad debe cumplir con las siguientes
propiedades
F(x) gt 0 (la funcioacuten es no negativa para cualquier valor de x f(x) no es
una probabilidad y puede valer maacutes de 1)
el aacuterea bajo la curva de la funcioacuten vale 1)
La funcioacuten de distribucioacuten para una variable aleatoria continua se calcula
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
F(a) = P(X lt
La probabilidad de que la variable esteacute dentro de un intervalo [a - b] se calcula
P (alt x lt b) = F(b) - F(a)
La probabilidad de que la variable tome un valor particular se puede expresar
como
F(c) - F(c) = 0
DISTRIBUCIONES DE PROBABILIDAD Y CUAL ES SU USO
Una distribucioacuten de probabilidad es un modelo matemaacutetico que asocia
valores de una variable aleatoria con sus respectivas probabilidades es
decir Probabilidad de x = Funcioacuten de x
Las distribuciones se caracterizan por una foacutermula que determina el tipo de
distribucioacuten y por un conjunto de paraacutemetros que son propios de cada espacio
muestral
En estadiacutestica matemaacutetica la distribucioacuten de probabilidad F(x) es una
funcioacuten de la probabilidad que representa los resultados que se van obteniendo en
un experimento aleatorio
Asiacute para un nuacutemero dado x la probabilidad es
A F(x) se le denomina Funcioacuten de Distribucioacuten de Probabilidad de la
variable X y representa la probabilidad de que la variable tome el valor desde
hasta x
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
Tambieacuten se puede definir como la acumulada de la funcioacuten de densidad de
probabilidad esta uacuteltima maacutes comuacutenmente conocida como funcioacuten de densidad
Para dos nuacutemeros reales cualesquiera a y b tal que (a lt b) los sucesos
y seraacuten mutuamente excluyentes y su suma es el
suceso por lo que tenemos entonces que
y finalmente
Por lo tanto una vez conocida la Funcioacuten de Distribucioacuten F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribucioacuten
de probabilidad de la variable
Como la probabilidad es siempre un nuacutemero positivo entonces la Funcioacuten
de Distribucioacuten seraacute una funcioacuten no decreciente que cumple lo siguiente
Es decir la probabilidad de todo el espacio muestral es 1 tal y como
establece la teoriacutea de la probabilidad y por otra parte
Es decir la probabilidad del suceso nulo es cero
Para realizar caacutelculos es maacutes coacutemodo conocer las distribucioacuten de
probabilidad para ver una representacioacuten graacutefica de la probabilidad es maacutes
praacutectico el uso de la funcioacuten de densidad
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
En el caso de una variable discreta la distribucioacuten puede describirse
mediante una funcioacuten de probabilidad que para cada valor de x de la variable X
determina la probabilidad de ser asumido P( X= x) = p (x) o bien por medio de
una funcioacuten de distribucioacuten de probabilidad acumulada o simplemente funcioacuten de
distribucioacuten la que para cada valor provee la probabilidad de no ser superado
evidentemente el valor de la funcioacuten de distribucioacuten es igual
a la suma de todos los valores de la funcioacuten de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive Lista de los resultados de un
experimento con las probabilidades que se esperariacutean ver asociadas con cada
resultado
Ejemplo Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales 2 3 4 5 6 7 8 9 10 11 12
En este caso vemos que la distribucioacuten de p(x) obtenida es simeacutetrica
Para el caso de 1 solo dado donde todos los valores tienen la misma
probabilidad de salir (16) obtendriacuteamos una distribucioacuten uniforme
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
Prueba de aleatoriedad
Con frecuencia se supone que los datos recopilados constituyen una
muestra aleatoria Sin embargo este tipo de premisa se puede probar mediante la
utilizacioacuten de un procedimiento no parametrico denominado ldquoPrueba de Wald ndash
Wolfowitz de corridas de una muestra para aleatoriedadrdquo
Se puede probar la hipoacutetesis nula de aleatoriedad si se observa el orden o
la sucesioacuten en que se obtienen las partidas Si a cada partida se asigna n uno o dos
siacutembolos como puede ser S y F (para eacutexito o fracaso) dependiendo de si la
partida tiene una propiedad en particular o de la cantidad o magnitud en que se
posee la propiedad se puede investigar la aleatoriedad de la sucesioacuten Si la
sucesioacuten se genera en forma aleatoria las partidas seraacuten independientes y con
distribucioacuten ideacutentica Esto significa que el valor de una partida seraacute independiente
de su posicioacuten en la sucesioacuten y de los valores de las partidas que la preceden y que
la siguen Por otra parte si una partida en la sucesioacuten resulta afectada por las
partidas que la preceden o las que la suceden en forma tal que la probabilidad de
su ocurrencia varia de una posicioacuten a otra el proceso no se considera como
aleatorio En estos casos las partidas similares tenderaacuten a agruparse (como cuando
esta presente una tendencia en los datos) o las partidas similares se mezclariacutean en
forma alternada dando lugar a que se presente alguacuten efecto perioacutedico sistemaacutetico
Para realizar la prueba de la hipoacutetesis nula de aleatoriedad se desglosa el
tamantildeo de la muestra total n en dos partes n1 eacutexitos y n2 fracasos El estadiacutestico
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
de prueba U el nuacutemero total de corridas se obtiene entonces por conteo Para una
prueba de dos colas si U es demasiado grande o demasiado pequentildea se puede
rechazar la hipoacutetesis nula de aleatoriedad a favor de la alternativa de que la
sucesioacuten no es aleatoria Sin embargo independientemente de si la prueba es de
una o dos colas para un tamantildeo de muestra n mayor que 40 (o cuando n1 o n2
exceden a 20) la prueba estadiacutestica U tiene una distribucioacuten cercana a normal Por
consiguiente se puede usar la siguiente formula de aproximacioacuten para muestras
grandes a fin de probar la hipoacutetesis de aleatoriedad
U
UUZ
donde
U = numero total de corridas
U = valor medio de U 12 21
n
nnU
U = desviacioacuten estaacutendar de U 1
222
2121
nn
nnnnnU
n1 = numero de eacutexitos en la muestra
n2 = numero de fracasos en la muestra
n = tamantildeo de la muestra n = n1 + n2
PRUEBA DE McNEMAR
Suele darse el caso en que se desean comparar las proporciones de los
datos de muestras tomados de poblaciones relacionadas En este caso se quisiera
determinar si hay diferencia entre dos grupos que se han apareado de acuerdo a
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
alguna caracteriacutesticas de control En una segunda circunstancia se deseariacutea
determinar si ha habido alguacuten cambio en determinado grupo entre un periodo y
otro Cuando hay dos proporciones (cada una con dos categoriacuteas) se puede
utilizar la prueba desarrollada por McNemar
El principal intereacutes es determinar si hay diferencia entre las dos
proporciones (prueba de dos colas) o si un grupo tiene una proporcioacuten mas alta
que el otro (prueba de una cola)
La prueba estadiacutestica para la prueba de McNemar es
CB
CBZ
PRUEBA U DE MANN ndash WHITNEY
Es una alternativa no parametrica a la prueba t de dos muestras para la
diferencia entre dos medias Con esta prueba se puede demostrar la hipoacutetesis nula
μ1 = μ2 sin tener que suponer que las poblaciones muestreadas tienen mas o menos
la forma de distribuciones normales de hecho la prueba solo requiere que las
poblaciones sean continuas (a fin de evitar coincidencias) y en la practica no
importa si se cumple o no esta suposicioacuten
Estadiacutesticos U1 y U2
111
2112
1 W
nnnnU
222
2122
1 W
nnnnU
PRUEBA DE RACHAS
Son todas las diferencias que tiene el mismo signo y se presentan en una
misma fila Una serie de n diferencias puede tener solamente una racha (toda
positiva o toda negativa) y puede tenerse n rachas si los signos se alternan Las
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
rachas pueden usarse para contrastar si dos muestras aleatorias proceden o no de
poblaciones con la misma distribucioacuten de frecuencias Colocamos las
observaciones de las dos muestras juntas en una serie seguacuten el tamantildeo Entonces
contamos el numero de rachas item de cada una de las muestras Si hay menos
rachas de las que esperaacutebamos (por casualidad) si ambas poblaciones son iguales
rechazamos la hipoacutetesis de que las dos poblaciones tienen la misma distribucioacuten
La teoriacutea de las rachas puede usarse tambieacuten para contrastar la hipoacutetesis de
que las observaciones se han sacado aleatoriamente de una sola poblacioacuten
Para hacer esto se halla la mediana de la muestra y se designa las
observaciones situadas por debajo de la mediana por un signo menos (-) y las
observaciones situadas por encima de la mediana por un signo (+) Si el numero
de rachas de signo mas o de signo menos es mayor o mas pequentildeo de lo esperado
rechazamos la hipoacutetesis Si N1 numero de veces que se presenta un tipo y N2 el
numero de veces que se presenta el otro tipo si N1 y N2 son ambas mayores de 10
puede obtenerse una distribucioacuten muestral acumulativa de u a partir del uso de la
tabla normal con
u
uu
z
2
1
12
21
21
NN
NNu
)1()(
2(2
21
2
21
2121212
NNNN
NNNNNNu
DESCRIBA DETALLADAMENTE CADA UNA DE LAS SIGUIENTES
DISTRIBUCIONES DE EJEMPLO Y USO
DISTRIBUCIOacuteN NORMAL O GAUSSIANA
Es el modelo de distribucioacuten maacutes utilizado en la praacutectica ya que
multitud de fenoacutemenos se comportan seguacuten una distribucioacuten normal
Esta distribucioacuten de caracteriza porque los valores se distribuyen formando
una campana de Gauss en torno a un valor central que coincide con el valor
medio de la distribucioacuten
Un 50 de los valores estaacuten a la derecha de este valor central y otro 50 a
la izquierda
Esta distribucioacuten viene definida por dos paraacutemetros
X N (m S2)
m es el valor medio de la distribucioacuten y es precisamente donde se situacutea el centro
de la curva (de la campana de Gauss) S2 es la varianza Indica si los valores
estaacuten maacutes o menos alejados del valor central si la varianza es baja los valores
estaacuten proacuteximos a la media si es alta entonces los valores estaacuten muy alejados de
ella Se representa por S2 porque su raiacutez cuadrada S es la denominada desviacioacuten
estaacutendar
Cuando la media de la distribucioacuten es 0 y la varianza es 1 se denomina
normal tipificada y su ventaja reside en que hay tablas o rutinas de caacutelculo
que permiten obtener esos mismos valores donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribucioacuten
Ademaacutes toda distribucioacuten normal se puede transformar en una normal
tipificada
Ejemplo Una variable aleatoria sigue el modelo de una distribucioacuten normal con
media 10 y varianza 4 Transformarla en una normal tipificada
X N (10 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y)
que seraacute igual a la anterior (X) menos su media y dividida por su desviacioacuten tiacutepica
(que es la raiacutez cuadrada de la varianza)
En el ejemplo la nueva variable seriacutea
Esta nueva variable se distribuye como una normal tipificada
permitieacutendonos por tanto conocer la probabilidad acumulada en cada valor
Y N (0 1) La distribucioacuten normal tipificada tiene la ventaja como ya hemos
indicado de que las probabilidades para cada valor de la curva se encuentran
recogidas en una tabla
MAacuteS DE DISTRIBUCIOacuteN NORMAL (GAUSSIANA)
La distribucioacuten gaussiana recibe tambieacuten el nombre de distribucioacuten
normal ya que una gran mayoriacutea de las va continuas de la naturaleza siguen esta
distribucioacuten Se dice que una va X sigue una distribucioacuten normal de paraacutemetros
y lo que representamos del modo si su funcioacuten de densidad
es
Observacioacuten
Estos dos paraacutemetros y coinciden ademaacutes con la media (esperanza) y
la varianza respectivamente de la distribucioacuten como se demostraraacute maacutes
adelante65
La forma de la funcioacuten de densidad es la llamada campana de Gauss
Figura Campana de Gauss o funcioacuten de densidad de una va de distribucioacuten
normal El aacuterea contenida entre la graacutefica y el eje de abcisas vale 1
Para el lector es un ejercicio interesante comprobar que eacutesta alcanza un
uacutenico maacuteximo (moda) en que es simeacutetrica con respecto al mismo y por tanto
con lo cual en coinciden la media la mediana
y la moda y por uacuteltimo calcular sus puntos de inflexioacuten
El soporte de la distribucioacuten es todo de modo que la mayor parte de la
masa de probabilidad (aacuterea comprendida entre la curva y el eje de abscisas) se
encuentra concentrado alrededor de la media y las ramas de la curva se extienden
asintoacuteticamente a los ejes de modo que cualquier valor ``muy alejado de la
media es posible (aunque poco probable)
La forma de la campana de Gauss depende de los paraacutemetros y
indica la posicioacuten de la campana (paraacutemetro de centralizacioacuten)
Figura Distribuciones gaussianas con diferentes medias e igual
dispersioacuten
(o equivalentemente ) seraacute el paraacutemetro de dispersioacuten Cuanto menor
sea mayor cantidad de masa de probabilidad habraacute concentrada alrededor
de la media (grafo de f muy apuntado cerca de ) y cuanto mayor sea
``maacutes aplastado seraacute
Figura Distribuciones gaussianas con igual media pero varianza
diferente
La funcioacuten caracteriacutestica de la distribucioacuten normal se comprueba maacutes
adelante que es
Como consecuencia la distribucioacuten normal es reproductiva con respecto a
los paraacutemetros y ya que
Observacioacuten
Como se ha mencionado anteriormente la ley de probabilidad gaussiana la
encontramos en la mayoriacutea de los fenoacutemenos que observamos en la naturaleza
por ello gran parte de lo que resta del curso lo vamos a dedicar a su estudio y a el
de las distribuciones asociadas a ella Sin embargo a pesar de su utilidad hay que
apuntar un hecho negativo para esta ley de probabilidad
La funcioacuten no posee primitiva66
conocida67
Las consecuencias desde el punto de vista praacutectico son importantes ya que
eso impide el que podamos escribir de modo sencillo la funcioacuten de distribucioacuten de
la normal y nos tenemos que limitar a decir que
sin poder hacer uso de ninguna expresioacuten que la simplifique Afortunadamente
esto no impide que para un valor de xfijo F(x) pueda ser calculado De hecho
puede ser calculado con tanta precisioacuten (decimales) como se quiera pero para esto
se necesita usar teacutecnicas de caacutelculo numeacuterico y ordenadores Para la utilizacioacuten en
problemas praacutecticos de la funcioacuten de distribucioacuten F existen ciertas tablas donde
se ofrecen (con varios decimales de precisioacuten) los valores F(x) para una serie
limitada de valores xi dados Normalmente F se encuentra tabulada para una
distribucioacuten Z normal de media 0 y varianza 1 que se denomina distribucioacuten
normal tipificada
En el caso de que tengamos una distribucioacuten diferente se
obtiene Z haciendo el siguiente cambio
De manera general se tiene
Proposicioacuten (Cambio de origen y escala)
Sean Entonces
Este resultado puede ser utilizado del siguiente modo Si y nos
interesa calcular
1 Hacemos el cambio y calculamos
2 Usamos la tabla 3 relativa a la distribucioacuten para obtener (de
modo aproximado) Como
tenemos que el valor obtenido en la tabla FZ(z) es la probabilidad buscada
Ejemplo
Supongamos que cierto fenoacutemeno pueda ser representado mediante una
va y queremos calcular la probabilidad de que Xtome un valor
entre 39 y 48 es decir
Comenzamos haciendo el cambio de variable
de modo que
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que
hemos mencionado anteriormente
Proposicioacuten
Sea Entonces
Demostracioacuten
Por ser la normal una ley de probabilidad se tiene que
es decir esa integral es constante Con lo cual derivando la expresioacuten anterior con
respecto a se obtiene el valor 0
luego
Para demostrar la igualdad entre la y basta con aplicar la misma
teacutecnica pero esta vez derivando con respecto a
Luego
Para demostrar el resultado relativo a la funcioacuten caracteriacutestica consideramos en
primer lugar la va tipificada de X
y calculamos
Como por la proposicioacuten 5 deducimos que
CURVA NORMAL ESTANDARIZADA
Una variable numeacuterica puede clasificarse como discreta o continua Las
variables discretas se miden utilizando nuacutemeros enteros y es posible asociarlas
con la idea de contar Las variables continuas se pueden asociar con la idea de
medir utilizando fracciones y decimales Cuando la variable es continua el
modelo probabiliacutestica que maacutes se usa es la distribucioacuten normal
El modelo matemaacutetico maacutes importante en estadiacutestica es la distribucioacuten
normal ya que provee una descripcioacuten adecuada para la distribucioacuten de una gran
cantidad de variables continuas
El modelo matemaacutetico
La funcioacuten matemaacutetica que se usa como modelo es
e = 271
π = 314
μx = media de la poblacioacuten
σx = desviacioacuten estaacutendar de la poblacioacuten
x = un valor de la variable continua
Como e y π son constantes la forma de la curva normal depende
solamente de los dos parametros de la distribucioacuten normal la media μx y la
desviacioacuten estaacutendar σx
Las diferentes curvas normales van a variar dependiendo de esos dos
paraacutemetros
En matemaacuteticas la ecuacioacuten de la distribucioacuten normal se puede representar
visualmente como una curva en forma de campana El aacuterea debajo de esta curva se
halla por medio del integral de la funcioacuten y corresponde al por ciento o la
proporcioacuten de puntuaciones que se encuentran en el intervalo dado
Propiedades de las distribuciones normales
a Son simeacutetricas y tienen forma de campana
b Al ser simeacutetricas la media la moda y la mediana coinciden
c Ql y Q3 estaacuten situados a 23 de una desviacioacuten estaacutendar El 68 del aacuterea
de la curva (probabilidad) se encuentra a una desviacioacuten estaacutendar de la media
d La variable tiene un alcance infinito pero la mayor parte del aacuterea bajo la
curva se encuentra a tres desviaciones estaacutendar de la media
En matemaacuteticas el aacuterea debajo de la curva se halla por medio del integral
de la funcioacuten Para evitar hacer esto se utilizan tablas que ya traen el aacuterea de
diferentes secciones de la curva o se utiliza la computadora para calcular ese valor
del aacuterea
La distribucioacuten normal estandarizada
Puesto que hay un nuacutemero infinito de combinaciones para los dos
paraacutemetros hay un nuacutemero infinito de curvas normales diferentes
Este problema se ha resuelto praacutecticamente al transformar los valores de
todas las distribuciones normales a los valores de una distribucioacuten normal
estandarizada representada por la curva normal estandarizada (standard normal
curve)
Las puntuaciones estandarizadas se logran restando la media a cada
observacioacuten y dividiendo entre la desviacioacuten estaacutendar
donde μx es la media de la distribucioacuten y σx su desviacioacuten estaacutendar
Propiedades de la distribucioacuten normal estandarizada
μ z = 0
σ z = 1
En muchas ocasiones se quieren comparar puntuaciones que pertenecen a
dos distribuciones normales diferentes La diferencia entre las dos distribuciones
radica en que las medias y las desviaciones estaacutendar no son iguales Sin embargo
la comparacioacuten se hace posible si se convierten las puntuaciones de ambas
distribuciones a puntuaciones z que corresponden a la distribucioacuten normal
estandarizada
Percentiles y rangos percentiles de una distribucioacuten normal estandarizada
Si se desea hallar la percentiles o el rango percentil en una distribucioacuten
normal no estandarizada se recurre al procedimiento de convertir las puntuaciones
de la distribucioacuten normal dada a puntuaciones z que corresponden a la
distribucioacuten normal estandarizada
Estos valores en la distribucioacuten normal estandarizada se pueden obtener
por medio de una tabla o de la computadora El aacuterea bajo la curva que aparece en
las tablas corresponde al por ciento o la proporcioacuten de puntuaciones en el
intervalo dado
Es necesario visualizar siempre el aacuterea debajo de la curva como el por
ciento de puntuaciones de la distribucioacuten normal estandarizada en un intervalo
dado
Cuando una distribucioacuten de puntuaciones es normal estandarizada la
pregunta iquestcuaacutel es el rango percentil de una puntuacioacuten dada se puede transformar
en preguntar iquestcuaacutel es el por ciento de puntuaciones bajo una puntuacioacuten dada o
cuaacutel es el aacuterea correspondiente a la parte de la curva menor de una puntuacioacuten
dada
DISTRIBUCIOacuteN GAMMA
Una variable aleatoria X asociada a un experimento aleatorio tiene una
distribucioacuten GAMMA si se caracteriza por las siguientes propiedades
Algunas alternativas de funciones de densidad se pueden ver en la graacutefica
del lado derecho Siendo los paraacutemetros de forma (amp) y escala (^)
respectivamente =1
=1
La Distribucioacuten Gamma tambieacuten se denomina Distribucioacuten Pearson Tipo
III
El modelo Gamma se ha utilizado frecuentemente en variables tales como
ndash El tiempo (oacute espacio) requerido para observar ocurrencias del evento A en el
intervalo t ( oacute regioacuten del espacio ) sucesos del tipo Poisson
ndash Problemas de traacutefico en liacuteneas telefoacutenicas ERLANG 1900
ndash Flujos maacuteximos MARKOVIC 1965
ndash Resistencia de componentes del concreto reforzado TICHY VARLIETK 1965
ndash Altura de la precipitacioacuten mensual WHITCOMB 1940
ndash Tiempo de falla de un sistema de amp componentes cada uno falla con frecuencia
infin
ndash Ingresos familiares
ndash Edad del hombre al contraer matrimonio por primera vez
ndash Tiempo total para completar una operacioacuten siacute eacutesta se lleva a cabo en
subestaciones a una frecuencia part
Ejemplo
Suponga que cierta pieza metaacutelica se romperaacute despueacutes de sufrir dos ciclos
de esfuerzo Si estos ciclos ocurren de manera independiente a una frecuencia
promedio de dos por cada 100 horas Obtener la probabilidad de que el intervalo
de tiempo se encuentre hasta que ocurre el segundo ciclo
a Dentro de una desviacioacuten con respecto del tiempo promedio
b A maacutes de dos desviaciones por encima de la media
Solucioacuten
X Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo en
horas
Y Nuacutemero de ciclos 100 horas ----Y ~P( =2) E(Y)
= 2
Y Nuacutemero de ciclos hora ---------Y~P( =002)
E(Y) = 002 =
X ~ G(2 002)
Ejemplo
En cierta ciudad el consumo diario de energiacutea eleacutectrica en millones de
kilovatios por hora puede considerarse como una variable aleatoria con
distribucioacuten GAMMA de paraacutemetros = 3 y
= 05
La planta de energiacutea de esta ciudad tiene una capacidad diaria de 10 millones de
KWhora
iquestCuaacutel es la probabilidad de que este abastecimientos sea
a Insuficiente en un diacutea cualquiera
b Se consuman entre 3 y 8 millones de K WHora
c c Encuentre E(x) y V(x)
SOLUCIOacuteN
DISTRIBUCIOacuteN PARETO
En estadiacutestica la distribucioacuten Pareto es una distribucioacuten de probabilidad
continua con dos paraacutemetros a y b cuya funcioacuten de densidad para valores
es
Su funcioacuten de distribucioacuten es
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten Pareto
son
El equivalente discreto de la distribucioacuten Pareto es la distribucioacuten zeta (
DISTRIBUCIOacuteN T DE STUDENT
Se Z eacute una distribucioacuten normal N(01) e W eacute entonces eacute una
distribucioacuten t con n grados de libertad
Cuando n--gtinfinito a curva t coincide com la normal estandarizada
FUNCIOacuteN DENSIDAD MEDIA E DESV TIP FX
MOMENTOS
La distribucioacuten -Student se construye como un cociente entre una normal
y la raiacutez de una independiente De modo preciso llamamos distribucioacuten t-
Student con n grados de libertad a la de una va T
donde Este tipo de distribuciones aparece cuando
tenemos n+1 va independientes
y nos interesa la distribucioacuten de
La funcioacuten de densidad de es
Figura Funcioacuten de densidad de una de Student
La distribucioacuten de Student tiene propiedades parecidas a
Es de media cero y simeacutetrica con respecto a la misma
Es algo maacutes dispersa que la normal pero la varianza decrece hasta
1 cuando el nuacutemero de grados de libertad aumenta
Figura Comparacioacuten entre las funciones de densidad de y
Para un nuacutemero alto de grados de libertad se puede aproximar la
distribucioacuten de Student por la normal es decir
Figura Cuando aumentan los grados de libertad la distribucioacuten de
Student se aproxima a la distribucioacuten normal tipificada
Para calcular
DISTRIBUCIOacuteN BETA
Sea un fenoacutemeno aleatorio y X una variable aleatoria que puede
representar una caracteriacutestica fiacutesica cuyos valores se encuentran restringidos a un
intervalo de longitud finita Tales como
Proporcioacuten de impurezas en un producto quiacutemico
La fraccioacuten de tiempo que una maacutequina estaacute en reparacioacuten
La proporcioacuten vendida de un lote durante un tiempo t
La humedad relativa medida en cierto lugar
Porcentaje del costo total destinado a reparacioacuten de maquinaria
Porcentaje de costo adicional destinado a reparacioacuten de maquinaria
La distribucioacuten del tiempo necesario para completar una fase del proyecto
PERT
Evaluacioacuten de programas y teacutecnicas de revisioacuten
Ejemplo
La proporcioacuten de tramos de una autopista que requieren repararse
semanalmente es una variable aleatoria con distribucioacuten Beta de paraacutemetros
= 3 y =2
a En promedio que porcentaje de tramos requiere proporcioacuten y con queacute variacioacuten
b Calcular la probabilidad de que a lo sumo la mitad de los tramos de la autopista
requieren reparacioacuten en un antildeo cualquiera
DISTRIBUCIOacuteN CAUCHY
En estadiacutestica la distribucioacuten de Cauchy (a veces tambieacuten distribucioacuten de
Lorentz) es una distribucioacuten de probabilidad continua cuya funcioacuten de densidad es
donde t y s gt 0 son sus paraacutemetros En general la distribucioacuten de Cauchy no tiene
valor esperado ni varianza
Si U y V son dos variables aleatorias uniformes dentro -1 y 1 y U2 + V
2 lt 1 el
numero U V tiene la distribucioacuten Cauchy
La distribucioacuten de Cauchy tambieacuten es la distribucioacuten t de Student con un
grado de libertad
Ejemplo
Sean y dos observaciones independientes de una distribucioacuten
Cauchy con funcioacuten de densidad
Puede demostrarse que si y son tales que entonces la
funcioacuten de verosimilitud de es bimodal
Sean y Supongamos que se desea hacer inferencias sobre el
valor de con base en esta informacioacuten y la distribucioacuten inicial no informativa
Especiacuteficamente interesa encontrar la distribucioacuten final de
Desafortunadamente en este caso la funcioacuten de verosimilitud y por lo tanto la
distribucioacuten final de tiene una forma complicada Es conveniente notar sin
embargo que corresponde a la densidad marginal de respecto a la
densidad conjunta
DISTRIBUCIOacuteN BERNOULLI
Consiste en realizar un experimento aleatorio una soacutela vez y observar si cierto
suceso ocurre o no siendo p la probabilidad de que esto sea asiacute (eacutexito) y q=1-p el
que no lo sea (fracaso) En realidad no se trata maacutes que de una variable
dicotoacutemica es decir que uacutenicamente puede tomar dos modalidades es por ello
que el hecho de llamar eacutexito o fracaso a los posibles resultados de las pruebas
obedece maacutes una tradicioacuten literaria o histoacuterica en el estudio de las va que a la
situacioacuten real que pueda derivarse del resultado Podriacuteamos por tanto definir este
experimento mediante una va discreta Xque toma los valores X=0 si el suceso no
ocurre y X=1 en caso contrario y que se denota
Un ejemplo tiacutepico de este tipo de variables aleatorias consiste en lanzar
una moneda al aire y considerar la va
Para una variable aleatoria (va) de Bernouilli tenemos que su funcioacuten de
probabilidad es
y su funcioacuten de distribucioacuten
Su funcioacuten caracteriacutestica es
Los principales momentos de la X los podemos calcular directamente
o bien usando la funcioacuten caracteriacutestica y la proposicioacuten de la paacutegina
Experimento aleatorio que tiene soacutelo dos resultados posibles (eacutexito o fracaso)
cuyas probabilidades permanecen constantes cualquiera sea el nuacutemero de
intentos
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE
BERNOULLI
Necesitamos ser cuidadosos en el uso de la distribucioacuten binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias en
particular las condiciones 2 y 3 La condicioacuten 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo La condicioacuten 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadiacutesticamente independientes es decir que el resultado de un intento no puede
afectar de ninguacuten modo el resultado de cualquier otro intento
DISTRIBUCIOacuteN EXPONENCIAL
Modelo para variable aleatoria continua que permite representar variables
del tipo tiempo entre o distancia entre dos eventos y vida uacutetil de ciertos
Componentes
En estadiacutestica la distribucioacuten exponencial es una distribucioacuten de
probabilidad continua con un paraacutemetro λ gt 0 cuya funcioacuten de densidad para
valores x gt 0 es
f(x) = λe - λx
Su funcioacuten de distribucioacuten es
Aqui e significa el nuacutemero e
El valor esperado y la varianza de una variable aleatoria X con
distribucioacuten exponencial son
E[X] = 1 λ
V(X) = 1 λ2
Ejemplo
Ejemplos para la distribucioacuten exponencial son los tiempos dentro
accidentes con probabilidad invariable
La funcioacuten de densidad para λ igual 05 10 y 15
DISTRIBUCIOacuteN MULTINOMIAL
La distribucioacuten multinomial es similar a la distribucioacuten binomial con la
diferencia de que en lugar de dos posibles resultados en cada ensayo
La distribucioacuten multinomial sigue el siguiente modelo
Donde
X1 = x1 indica que el suceso X1 aparezca x1 veces (en el ejemplo
que el partido POPO lo hayan votado 3 personas)
n indica el nuacutemero de veces que se ha repetido el suceso (en el
ejemplo 5 veces)
n es factorial de n (en el ejemplo 5 4 3 2 1)
p1 es la probabilidad del suceso X1 (en el ejemplo el 40)
Veamos el ejemplo
Luego
P = 00256
Es decir que la probabilidad de que las 5 personas elegidas hayan votado
de esta manera es tan soacutelo del 256
Nota 0 es igual a 1 y cualquier nuacutemero elevado a 0 es tambieacuten igual a 1
Veamos otro ejemplo
En una fiesta el 20 de los asistentes son espantildeoles el 30 franceses el
40 italiano y el 10 portugueses En un pequentildeo grupo se han reunido 4
invitados iquestcual es la probabilidad de que 2 sean espantildeoles y 2 italianos
Aplicamos el modelo
LuegoP = 00384
Por lo tanto la probabilidad de que el grupo esteacute formado por personas de
estos paiacuteses es tan soacutelo del 384
DISTRIBUCIOacuteN UNIFORME
En estadiacutestica la distribucioacuten uniforme es una distribucioacuten de
probabilidad cuyos valores tienen la misma probabilidad
Caso discreto
Su funcioacuten de probabilidad es en el caso discreto con valores posibles
p(xi) = 1 n
Su funcioacuten de distribucioacuten es en el caso discreto
Su media estadiacutestica es
Caso continuo
Su funcioacuten de probabilidad en el caso continuacuteo entre los valores a y b
La funcioacuten de densidad en el caso continuo entre a y b es
Su media estadiacutestica es (a + b) 2 y su varianza (b - a)2 12
Ejemplos
Para un dado perfecto todos los resultados tienen la misma probabilidad 1
6
Calcular variables aleatorias
Las variables aleatorias de probabilidad uniforme pueden calcularse con un
generador de variables aleatorias
DISTRIBUCIOacuteN BINOMIAL
En estadiacutestica la distribucioacuten binomial es una distribucioacuten probabilidad
discreta describiendo el nuacutemero de eacutexitos de n experimentos independientes con
probabilidad p de un eacutexito
Su funcioacuten de densidad es
Eso es por que en n experimentos hay n sobre x (el coeficiente binomial)
posibilidades para un numero de x eacutexitos (probabilidad pk) y n - x no-eacutexitos
((1 - p)n - x
)
El valor esperado de una variable aleatoria de probabilidad binominal es
E[x] = np y su varianza V[x] = np(1 - p)
DISTRIBUCIOacuteN BINOMIAL NEGATIVA
Sobre una sucesioacuten de va de Bernouilli independientes
Se define la va X como el nuacutemero de fracasos obtenidos hasta la aparicioacuten de r
eacutexitos en la sucesioacuten En este caso se dice que X sigue una ley de
distribucioacuten binomial negativa de paraacutemetros r y p y se denota del modo
Su ley de probabilidad se deduce siguiendo el esquema
De nuevo el conjunto de posibles valores de esta va discreta es
Su funcioacuten caracteriacutestica es
y sus momentos maacutes importantes los obtenemos derivando esta uacuteltima
Ejemplo
Para tratar a un paciente de una afeccioacuten de pulmoacuten han de ser operados en
operaciones independientes sus 5 loacutebulos pulmonares La teacutecnica a utilizar es tal
que si todo va bien lo que ocurre con probabilidad de 711 el loacutebulo queda
definitivamente sano pero si no es asiacute se deberaacute esperar el tiempo suficiente para
intentarlo posteriormente de nuevo Se practicaraacute la cirugiacutea hasta que 4 de sus
5loacutebulos funcionen correctamente iquestCuaacutel es el valor esperado de intervenciones
que se espera que deba padecer el paciente iquestCuaacutel es la probabilidad de que se
necesiten 10 intervenciones
Solucioacuten Este es un ejemplo claro de experimento aleatorio regido por
una ley binomial negativa ya que se realizan intervenciones hasta que se obtengan
4 loacutebulos sanos y eacuteste es el criterio que se utiliza para detener el proceso
Identificando los paraacutemetros se tiene
Lo que nos interesa es medir el nuacutemero de intervenciones Y maacutes que el
nuacutemero de eacutexitos hasta el r-eacutesimo fracaso La relacioacuten entre ambas va es muy
simple
Y=X+r
Luego
Luego el nuacutemero esperado de intervenciones que deberaacute sufrir el paciente
es de 11 La probabilidad de que el nuacutemero de intervenciones sea Y=10 es la de
que X=10-4=6 Por tanto
La distribucioacuten binomial negativa tambieacuten se puede definir como el
nuacutemero de pruebas hasta la aparicioacuten de r eacutexitos Como el nuacutemero de pruebas
contabiliza tanto los eacutexitos como los fracasos se tendriacutea seguacuten eacutesta definicioacuten que
DISTRIBUCIOacuteN DE POISSON
Modelo para variable aleatoria discreta que permite calcular la
probabilidad de obtener x eacutexitos en un intervalo continuo Distribucioacuten
discreta en la que la probabilidad de presentacioacuten de un evento en un intervalo
muy pequentildeo es un nuacutemero tambieacuten muy pequentildeo la probabilidad de que dos
o maacutes eventos se presenten dentro del mismo intervalo es efectivamente igual
a cero y la probabilidad de presentacioacuten del evento dentro del periacuteodo dado es
independiente de cuaacutendo se presenta dicho periacuteodo
En estadiacutestica la distribucioacuten de Poisson es una distribucioacuten de
probabilidad discreta con un paraacutemetro λ lt 0 cuya funcioacuten de masa para sucesos
es
Aquiacute e significa el nuacutemero e y x significa el factorial de x
La distribucion de Poisson describe el nuacutemero de sucesos en una unidad
de tiacuteempo de un proceso de Poisson Muchos fenoacutemenos se modelan como un
proceso de Poisson por ejemplo las llamadas en una empresa o los accidentens
en una carrera
El valor esperado y la varianza de una variable aleatoria X de distribucioacuten
Poisson son
E[X] = V[X] = λ
La distribucioacuten de Poisson se utiliza para describir cierto tipo de procesos
entre los que se encuentran la distribucioacuten de llamadas telefoacutenicas que llegan a un
conmutador la demanda (necesidades) de los pacientes que requieren servicio en
una institucioacuten de salud las llegadas de camiones a una caseta de cobro y el
nuacutemero de accidentes registrados en una cierta interseccioacuten de calles Estos
ejemplos tienen en comuacuten un elemento pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0 1 2)
Caacutelculo de la probabilidad de Poisson
La letra X por lo general representa a una variable discreta y puede tomar
valores enteros Utilizamos la letra X para representar a la variable aleatoria y la
letra x para sentildealar un valor especiacutefico que esta variable pueda tomar La
probabilidad de tener exactamente x presentaciones en una distribucioacuten de Poisson
se calcula con la foacutermula
LA DISTRIBUCIOacuteN DE POISSON COMO UNA APROXIMACIOacuteN A LA
DISTRIBUCIOacuteN BINOMIAL
La distribucioacuten de Poisson puede ser un razonable aproximacioacuten a la
binomial pero soacutelo bajo ciertas condiciones Tales condiciones se presentan
cuando n es grande y p es pequentildea esto es cuando el nuacutemero de ensayos es
grande y la probabilidad binomial de tener eacutexito es pequentildea La regla que utilizan
con maacutes frecuencia los estadiacutesticos es que la distribucioacuten de Poisson es una buena
aproximacioacuten de la distribucioacuten binomial cuando n es igual o mayor que 20 y p es
igual o menor que 005 En los casos en que se cumplen estas condiciones
podemos sustituir la media de la distribucioacuten binomial (np) en lugar de la media
de la distribucioacuten de Poisson
DISTRIBUCIOacuteN GEOMEacuteTRICA
En estadiacutestica la distribucioacuten geomeacutetrica es una distribucioacuten
probabilidad discreta con un paraacutemetro p cuya funcioacuten de densidad para valores
discretos es
P(X = x) = p(1 - p)x - 1
Su funcioacuten de distribucioacuten es
El paraacutemetro p (la probabilidad de eacutexito de un experimento) fija la media
estadiacutestica E(X) = 1 p y la varianza V(X) = (1 - p) p2
Ejemplo
El nuacutemero de tirar una cifra determinada con un dado x veces seguidas es
una distribucioacuten geomeacutetrica con el paraacutemetro p = 1 6
DISTRIBUCIOacuteN HIPERGEOMEacuteTRICA
En estadiacutestica la Distribucioacuten hipergeomeacutetrica es una distribucioacuten de
probabilidad discreta con tres paraacutemetros discretos N M y n cuya funcioacuten de
masa para valores es
Aqui (a sobre b) es el coeficiente binomial
El valor esperado de una variable aleatoria X de distribucioacuten
hipergeomeacutetrica es
Y su varianza
DISTRIBUCIOacuteN ZETA
En estadiacutestica la distribucioacuten zeta es una distribucioacuten probabilidad
discreta con un paraacutemetro s gt 1 cuya funcioacuten de densidad para valores discretos
es
Aqui ζ(s) es la funcioacuten zeta de Rieman con
El equivalente continuo de la distribucioacuten zeta es la distribucioacuten Pareto
DISTRIBUCION CHI CUADRADO
El llamado Test de Chi-cuadrado Es muy usual la necesidad de hacer una
comparacioacuten global de grupos de frecuencias Para este problema el meacutetodo es
diferente pues el test que se utiliza se denomina Chi-Cuadrado de Pearson y con
ese test lo que queremos determinar es si la frecuencia observada de un fenoacutemeno
es significativamente igual a la frecuencia teoacuterica prevista o siacute por el contrario
estas dos frecuencias acusan una diferencia significativa para por ejemplo un
nivel de significacioacuten del 5
El anaacutelisis de las tablas de contingencia se utiliza para el estudio de la
asociacioacuten entre variables cualitativas La prueba Chi-Cuadrado fue desarrollada
por Karl Pearson (1857-1936) en 1900 aplicando sus resultados en el aacutembito
bioloacutegico Sir Ronald Aylmer Fisher (1890-1962) fue un brillante estadiacutestico autor
del famoso libro Statistical Methods for Research Workers (1925) donde se
marcaban las pautas de la estadiacutestica tal y como se conoce hoy en diacutea Trabajoacute con
Pearson aunque debido a disputas personales fue a trabajar a Rothamsted donde
estudioacute el disentildeo de experimentos introduciendo el concepto de aleatorizacioacuten y
el de anaacutelisis de la varianza Se puede decir que RA Fisher fue el padre de las
pruebas exactas particularmente desarrolloacute la prueba que se conoce como prueba
exacta de Fisher
Las posibles aplicaciones son muchas eleccioacuten de un cartel turiacutestico
publicitario presentado a grupos de clientes comparar la rentabilidad de un
proyecto hotelero en dos espacios turiacutesticos determinar las preferencias o gustos
de los turistas por determinados espacios geograacuteficos o por determinados
servicios hoteleros etc El meacutetodo que se sigue es el siguiente 1) Se designan las
frecuencias observadas con letras minuacutesculas y con letras mayuacutesculas las
frecuencias esperadas o teoacutericas 2) Las frecuencias se presentan en cuadros o
tablas con un cierto nuacutemero de columnas y de filas Pueden ser tablas de 1 x 2 o
de 2 x 2 etc Aplicaremos el meacutetodo con una tabla 1 x 2 y despueacutes con una tabla 2
x 2 Supongamos que se ha comprobado fallas leves (atributos) en dos proyectos
turiacutesticos que no han satisfecho plenamente a la clientela Estas fallas han
ocurrido en los sitios turiacutesticos A y B O sea de un total de 102 fallas 59 han
tenido lugar en el sitio A y 43 fallas en el sitio B Formulamos la hipoacutetesis nula
que no existe relacioacuten entre el nuacutemero de fallas y el hecho de que hayan ocurrido
en los sitios A y B
Si la hipoacutetesis nula no se rechaza quiere decir que cada sitios es
independiente del hecho y entonces no existe razoacuten para suponer que por ejemplo
A es menos predispuesto a fallas que B Si se rechaza la hipoacutetesis nula entonces
alguno de los dos sitios si estaacute propenso a mayor nuacutemero de fallas Para este
anaacutelisis se aplica el test Chi-cuadrado de Pearson Vamos a observar los datos
empiacutericos (59 y 43= 102) y los datos esperados o sea una reparticioacuten por igual de
las fallas entre el proyecto A y el B (51 y 51 = 102) a = 59 b = 43 A = 51 B = 51
La foacutermula que permite obtener el Chi-cuadrado incluye una correccioacuten
igual a O50 por ser muestras pequentildeas y su valor estimado con la foacutermula es
2206 Al ir a la tabla del encontramos que para un grado de libertad el valor del
Chi-cuadrado debe ser igual o mayor que 3841 para un nivel de significacioacuten del
5 Dado que el valor encontrado en el anterior caacutelculo es igual a 2206
podemos admitir que la hipoacutetesis nula es correcta pues no existe razoacuten para
suponer que se produzcan maacutes fallas en el espacio turiacutestico A que en el espacio B
Si la tabla es de 2 x 2 De nuevo el fin del test es comparar las frecuencias
observadas empiacutericamente de dos muestras con las frecuencias esperadas o
teoacutericas Dos procedimientos de refrigeracioacuten (ldquoxrdquo e ldquoyrdquo) se han ensayado en el
Dpto de Alimentos y Bebidas de un Hotel con el fin de aumentar la duracioacuten de
las materias primas perecederas Los resultados son seguacuten atributos cualitativos
los siguientes Primero veremos las frecuencias empiacutericas u observadas
Refrigeracioacuten X fracasos =77 eacutexitos =63 y el total 140 Y para la Refrigeracioacuten
Y fracasos = 54 eacutexitos = 66 y el total 120 Los totales de las tres columnas son
131129 y 260 En seguida veremos las frecuencias teoacutericas o esperadas
Refrigeracioacuten X fracasos = 7054 eacutexitos=6946 y el total 140 Refrigeracioacuten Y
fracasos =6046 eacutexitos = 5954 y el total 120 Todos los totales de las tres
columnas son 131129 y 260 Las frecuencias teoacutericas fueron estimadas de esta
maneraa1 = 131 x 140 260 = 7054 b1 = 129 x 140 260 = 6946 a2 = 131 x
120 260 = 6046 b2 = 129 x 120 260 = 5954
Cuando las muestras son pequentildeas se aplica en la foacutermula una correccioacuten
igual a 050 Y al aplicar la foacutermula del Chi-cuadrado obtenemos el valor de
2200 De nuevo se compara el resultado 220 con el de la tabla para un grado de
libertad y para el nivel de significacioacuten del 5 con un valor de 3841 La
diferencia entre las dos muestras no es significativa y no se puede llegar a ninguna
conclusioacuten razonada sobre los dos procedimientos de refrigeracioacuten
Es una medida de la discrepancia existente entre las frecuencias
observadas y esperadas Esta prueba es de mucha utilidad para los casos del uso
de frecuencias () debido a que permite determinar las desviaciones entre ellas
ademaacutes estima el contraste entre grupos para el caacutelculo de frecuencias por la
expresioacuten
E
EOX
2
2
Donde
O frecuencia observada
E frecuencia teoacuterica esperada
TEST DE CHI-CUADRADO DE CONTINGENCIA
Un caso particular del test de chi-cuadrado que permite hacer un test sobre
la independencia de dos caraacutecteres estadiacutesticos lleva el nombre de test de chi-
cuadrado de contingencia Los dos caracteres observados en una misma
poblacioacuten son e el tamantildeo de la muestra es Las modalidades o clases
de se denotan las de por Tambieacuten vamos a
denotar
el efectivo conjunto de y es el nuacutemero de individuos para los
cuales toma el valor e el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
el efectivo marginal de es el nuacutemero de
individuos para los cuales toma el valor
Estos valores se representan en una tabla de doble entrada conocida como
tabla de contingencia
Cada fila y cada columna corresponden a una submuestra particular La
fila de iacutendice es la distribucioacuten en las clases de los individuos para
los cuales el caraacutecter toma el valor La columna de iacutendice es la
distribucioacuten en las clases de los individuos para los cuales el caraacutecter
toma el valor Dividiendo las filas y las columnas por su suma se obtienen
frecuencias condicionales para cada una de las distribuciones empiacutericas Para
y las denotaremos por
y
Estas distribuciones empiacutericas condicionales se llaman los perfiles fila y
los perfiles columna Para el modelo probabilista las observaciones provienen de
una muestra
de una ley bidimensional La hipoacutetesis a comprobar
es que los dos marginales de esta ley son independientes Si este es el caso los
perfiles fila diferiraacuten poco de la distribucioacuten empiacuterica de y los perfiles columna
de la de
y
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de
los productos de las frecuencias marginales
Las frecuencias conjuntas por un lado (distribucioacuten observada) y los
productos de frecuencias marginales por el otro (distribucioacuten teoacuterica) constituyen
dos distribuciones de probabilidad sobre el conjunto producto
Podemos por tanto calcular la distancia de
chi-cuadrado de una con respecto a la otra
Proposicioacuten 25 La distancia de chi-cuadrado de contingencia de la
distribucioacuten empiacuterica a la distribucioacuten teoacuterica estimada vale
Demostracioacuten La primera expresioacuten es la aplicacioacuten directa de la
definicioacuten 23 Para obtener la segunda desarrollamos el cuadrado
Por lo dicho anteriormente para suficientemente grande podemos
aproximar la ley de por la ley de chi-cuadrado cuyo paraacutemetro es el
nuacutemero de clases menos restando ademaacutes el nuacutemero de paraacutemetros estimados
a partir de los datos agrupados en clases Aquiacute son las frecuencias marginales las
que han sido estimadas Hay para el caraacutecter y para el caraacutecter
(la uacuteltima es el complemento a de la suma de las otras) El paraacutemetro de la ley
chi-cuadrado seraacute por tanto
Vamos a presentar un ejemplo de dos caracteres binarios que tienen que
ver con enfermos para los cuales se ha observado si tienen o no una tendencia al
suicidio (caraacutecter ) Las enfermedades han sido clasificadas como psicosis y
neurosis (caraacutecter ) Se quiere saber si existe una dependencia entre las
tendencias al suicidio y la clasificacioacuten de los enfermos Supongamos que la tabla
de contingencia observada es
Tendencia Sin tendencia Total
Psicosis 20 180 200
Nneurosis 60 140 200
Total 80 320 400
La distancia de chi-cuadrado de contingencia calculada a partir de esta
tabla es de El valor tomado por el estadiacutegrafo es el cual
debemos comparar con la ley El p-valor es de
Rechazamos la hipoacutetesis nula y concluimos que hay una dependencia entre
la tendencia al suicidio y la clasificacioacuten de las enfermedades
El test no precisa el sentido de esta dependencia Para describirla hay que
comparar las proporciones de los suicidas entre los neuroacuteticos ( ) y entre
los sicoacuteticos ( ) El test de proporciones formaliza esta comparacioacuten
PRUEBA DE CHI CUADRADO PARA VARIABLES CATEGOacuteRICAS
Los investigadores se interesan constantemente en las diferencias entre dos
poblaciones en teacuterminos de una variable cualitativa o categoacuterica (a saber estado
civil profesioacuten color de ojos preferencia por una marca etc)
Se puede desarrollar una tabla en dos sentidos denominada ldquotabla de
contingenciardquo
Se puede realizar una prueba para la diferencia entre dos proporciones
sobre la base de muestras independientes usaacutendose como instrumento la prueba
de chi cuadrado
El meacutetodo comienza con la hipoacutetesis nula de que la proporcioacuten de eacutexito es
la misma en las dos poblaciones (p1 = p2) Si esta hipoacutetesis nula fuera cierta se
podriacutea calcular las frecuencias que teoacutericamente se encontrariacutean en cada celda
Las frecuencias teoacutericas E para cada celda se puede calcular utilizando la
ecuacioacuten
n
nnE CR
donde
nR nuacutemero total en el rengloacuten
nC nuacutemero total en la columna
n tamantildeo total de la muestra
El meacutetodo de anaacutelisis mediante chi cuadrado usa la diferencia al cuadrado
entre la frecuencia observada y la frecuencia teoacuterica en cada celda La diferencia
al cuadrado se divide entre la frecuencia esperada de la celda
La hipoacutetesis nula de igualdad entre las dos proporciones (p1 = p2) se
rechazaraacute cuando el valor calculado de la prueba estadiacutestica sea mayor que el
valor critico de la distribucioacuten de chi cuadrado con el numero apropiado de grados
de libertad Los grados de libertad se determinan por ν = n ndash 1 donde n es el
tamantildeo de la muestra
CHI CUADRADO COMO PRUEBA DE HOMOGENEIDAD
Tanto la distribucioacuten normal como las pruebas de chi cuadrado conducen a
las mismas conclusiones si se estudia la diferencia entre dos proporciones Esto se
puede explicar por la relacioacuten entre el valor de la distribucioacuten normal y el de la
distribucioacuten chi cuadrado con grados de libertad El estadiacutestico chi cuadrado
siempre seraacute el cuadrado de la prueba estadiacutestica basada en la distribucioacuten normal
Por consiguiente al probar la diferencia entre las dos proporciones la
distribucioacuten normal y la prueba chi cuadrado proporcionan meacutetodos equivalentes
Sin embargo si se esta interesado especiacuteficamente en determinar una diferencia
direccional como p1 gt p2 entonces se tiene que usar la prueba de distribucioacuten
normal
La igualdad entre la distribucioacuten normal y la prueba chi cuadrado se puede
ilustrar mediante el siguiente ejemplo
Cuartos de bantildeos modernos
Cocina moderna Caren
cia
existenc
ia
totales
Carencia 72 8 80
Existencia 7 146 153
La hipoacutetesis nula y alternativa seriacutean
YN ppH 0
YN ppH 0
Si la prueba se realiza utilizando la distribucioacuten normal y un nivel de
significancia de 005 los valores criacuteticos seraacuten +196 y ndash196 y la decisioacuten seraacute
Rechazar 0H si 961Z o si Zlt -196 de lo contrario aceptar 0H
A partir de la informacioacuten del cuadro
10080
8
N
NSN
n
Xp 95420
153
146
Y
YSY
n
Xp
A partir de la expresioacuten
21
21
111
nnpp
pPZ SS
donde
661015380
1468
p
por lo tanto
0813
153
1
80
133906610
95420100
Z
Totales 79 154 223
Dado que 1960813 Z se rechaza la 0H por lo tanto hay
diferencia entre las dos proporciones
Usando la prueba de chi cuadrado y la tabla de contingencia de este
ejemplo se tiene
Las frecuencias teoacutericas se pueden obtener a partir de la siguiente
ecuacioacuten
n
nnE CR
Por lo tanto se tiene
1227233
7980E 8852
233
15480E
8851233
79153E 12101
233
154153E
Chi cuadrado se obtiene a partir de la expresioacuten
E
EOX
2
2
A partir de la tabla se tiene
O E (O ndash E) (O ndash E)2
(O ndash E)2E
7
2
2
712
+4488 20142144 742704
7 5
188
- 4488 20142144 388245
8 5 -4488 20142144 380903
288
1
46
1
0112
+4488 20142144 199191
1711043
10431712 CALCULADOX
Para ν = 2 ndash 1 = 1 y un nivel de significancia de 005 el
84132 TABULADOX puesto que TABULADOCALCULADO XX 22 se rechaza 0H por lo
tanto hay diferencia entre las dos proporciones
Noacutetese que el valor de la prueba de chi cuadrado es el cuadrado de la
distribucioacuten normal 104317108132 tambieacuten se puede observar en las dos
distribuciones que a un nivel de significancia de 005 el valor de 196 es el
cuadrado de 3 841 es decir 22 ZX
CHI CUADRADO COMO PRUEBA DE INDEPENDENCIA
La afirmacioacuten de que no existen diferencias entre proporciones significa
que las dos variables son independientes Cuando las conclusiones se presentan en
esta forma la prueba de chi cuadrado se conoce como ldquoprueba de independenciardquo
Si no se puede rechazar la hipoacutetesis nula se llegariacutea a la conclusioacuten se que
no existe evidencia de una relacioacuten entre las dos variables Si se rechaza la
hipoacutetesis nula se llegariacutea a la conclusioacuten de que si hay una relacioacuten entre las dos
variables Independientemente de que la prueba de chi cuadrado se considera una
prueba de diferencia entre dos proporciones o una prueba de independencia los
caacutelculos y resultados son exactamente los mismos
CHI CUADRADO COMO PRUEBA DE LA BONDAD DE AJUSTE
Con esta prueba se comparan las frecuencias reales en cada categoriacutea (o
intervalo de clase) con las frecuencias que se esperariacutea teoacutericamente que
ocurrieran si la informacioacuten siguiera la distribucioacuten seleccionada de
probabilidades
Para realizar la prueba de chi cuadrado de bondad de ajuste se tienen que
seguir varios pasos Primero se tiene que establecer la distribucioacuten de
probabilidad que se debe ajustar a la informacioacuten Segundo los valores de cada
paraacutemetro de la distribucioacuten de probabilidad seleccionada (como puede ser la
media) se deben establecer mediante hipoacutetesis o estimarlos con base a la
informacioacuten real Despueacutes se usa la distribucioacuten de probabilidad seleccionada para
determinar la probabilidad y luego la frecuencia teoacuterica para cada categoriacutea o
intervalo de clase Por ultimo se puede utilizar la prueba estadiacutestica chi cuadrado
para probar si la distribucioacuten de probabilidad seleccionada es ldquoadecuadardquo para la
informacioacuten
BONDAD DE AJUSTE PARA UNA DISTRIBUCIOacuteN POISSON
La prueba chi cuadrado de bondad de ajuste para una distribucioacuten de
Poisson se puede ilustrar mediante el siguiente ejemplo donde se desea saber si la
cantidad de automoacuteviles estacionados en una cochera cubierta siguen una
distribucioacuten de Poisson 0H
En la tabla siguiente se muestra la distribucioacuten de frecuencias del nuacutemero
de automoacuteviles que se pueden estacionar en instalaciones bajo techo para una
muestra aleatoria de 233 casas
Numero de automoacuteviles Frecuencia
0 61
1 151
2 21
233
Se calcula el nuacutemero promedio de la muestra de automoacuteviles estacionados
de la distribucioacuten de frecuencia
No de automoacuteviles Frecuencia observada On
0 61 0
1 151 151
2 21 42
233 193
808280233
193
1
n
On
X
n
i por lo tanto 80X
El valor de la media muestral se utilizara como el estimado de X
Mediante la tabla 1 del anexo se determina la probabilidad de X eacutexito (X = 012)
y se obtiene la frecuencia teoacuterica para cada una
Automoacutevil
n
Frecuencia
O
Probabilidad
XP
Frecuencia (E)
XPn
0 61 04493 104687
1 151 03595 87764
2 21 01438 33505
Los grados de libertad son ν = 3-1 = 2 si se selecciona un nivel de
significancia de 005 el valor tabulado de chi cuadrado es 99152 TABULADOX
El valor calculado de chi cuadrado es
50679
2
2
K
CALCULADO
E
EOX
Puesto que 79506 gt 5991 la hipoacutetesis se rechaza y la cantidad de
automoacuteviles que se pueden estacionar en una cochera cubierta no siguen una
distribucioacuten de Poisson
CORRECCIOacuteN DE YATES
Cuando se aplican a datos discretos los resultados para distribuciones
continuas deben hacerse ciertas correcciones Cuando se tiene de dos a tres
comparaciones o grupos se utiliza la prueba de chi cuadrado con correccioacuten de
Yates la cual viene dada mediante la expresioacuten
E
EOX CALCULADO
502
2
En general la correccioacuten se hace solamente cuando el numero de grados
de libertad es ν = 1 En muestras grandes se obtienen praacutecticamente los mismos
resultados que la chi cuadrado no corregida pero pueden aparecer dificultades en
relacioacuten con los valores criacuteticos Para muestras pequentildeas donde cada frecuencia
esperada se encuentra entre 5 y 10 quizaacutes sea mejor comparar los valores de chi
cuadrado corregido y no corregido Si ambos valores conducen a la misma
conclusioacuten seguacuten una hipoacutetesis tal como rechazarla al nivel de 005 raramente se
presentan dificultades Si conducen a conclusiones diferentes se puede o bien
incrementar los tamantildeos mueacutestrales o si esto no es posible se pueden emplear
meacutetodos de probabilidad exactos
El uso de la correccioacuten de Yates se puede ilustrar mediante el siguiente
ejemplo
En 200 lanzamientos de una moneda se observaron 115 caras y 85 cruces
Ensayar la hipoacutetesis de que la moneda esta bien hecha con un nivel de
significancia del 005
No de caras Frecuencia Probabilidad Frecuencia (E)
Cara 115 05 100
cruce 85 05 100
2054
100
0510085
100
0510011522
2
CALCULADOX
Para ν = 1 y una significancia de 005 se tiene que el valor de chi cuadrado
con correccioacuten de Yates es
8432 TABULADOX
Puesto que 4205gt 384 se rechaza la hipoacutetesis de la moneda bien hecha
PRUEBA EXACTA DE FISHER
Para examinar la igualdad de las varianzas de dos poblaciones
independientes se ha creado un procedimiento estadiacutestico basado en la razoacuten de
las varianzas de las dos muestras Suponiendo que la informacioacuten de cada
poblacioacuten tiene distribucioacuten normal entonces la razoacuten 2
2
2
1 SS sigue una
distribucioacuten denominada distribucioacuten Fisher que debe su nombre al famoso
estadiacutestico RA Fisher
Los valores criacuteticos de la distribucioacuten F dependen de dos conjuntos de
grados de libertad los grados de libertad en el numerador y en el denominador
la prueba estadiacutestica para probar la igualdad entre dos varianzas seriacutea
2
2
2
111 21
S
SF nn
donde
n1 = tamantildeo de muestra en el grupo 1
n2 = tamantildeo de muestra en el grupo 2
n1 ndash 1 = grados de libertad en el grupo 1
n2 ndash 1 = grados de libertad en el grupo 2
2
1S varianza de la muestra en el grupo 1
2
2S varianza de la muestra en el grupo 2
Al probar la igualdad de dos varianzas se pueden emplear pruebas de una
cola o de dos colas
El uso del meacutetodo de Fisher se puede ilustrar mediante el siguiente
ejemplo
Se desea conocer la variabilidad en la cantidad de llenado podriacutea ser mas
alta en la planta A que en la planta B Para determinar la variabilidad se puede
establecer una prueba de una cola en la forma siguiente
22 BAOH
22
1 BAH
Puesto que el grupo 1 consta de 25 cajas de cereales llenadas en la planta
A y el grupo 2 consta de 20 cajas llenadas en la planta B la regioacuten de rechazo esta
ubicada en la cola superior de la distribucioacuten
Para νA= n1ndash1= 25ndash1= 24 y νB= n1ndash1= 20ndash1= 19 Al haber 24 grados de
libertad en el numerador y 19 en el denominador a un nivel de significancia de
001 el valor de Fisher tabulado es 292 Para la varianza de A y de B se tiene
71162 AS y 20142 BS por lo tanto
38512014
71162
2
1924 F como 1385 lt
292 no se rechaza la hipoacutetesis nula ( OH )
CONCLUSIOacuteN
La conclusioacuten que los resultados de una medida variable es la causa de
variacioacuten en otra variable cuando un anaacutelisis produce una significacioacuten
estadiacutestica La correlacioacuten de dos variables puede ser grande y significativa pero
no puede reclamar legitimidad
La etapa de deteccioacuten y correccioacuten de errores un primer paso consiste en
describir la distribucioacuten de las variables estudiadas y en particular de los datos
numeacutericos Ademaacutes de las medidas descriptivas correspondientes el
comportamiento de estas variables puede explorarse graacuteficamente de un modo
muy simple Consideremos La teoriacutea combinatoria es en parte el cerebro
organizador de las ciencias computarizadas y el modelo que nos dota de un
mejor razonamiento para implementar programas eficientes En este sentido la
combinatoria es el aacuterea de mayor expansioacuten en las matemaacuteticas modernas y un
reciente panel de cientiacuteficos notables ha recomendado cursos de combinatoria en
colegios y universidades
Especialistas de distintas ramas indagan cada diacutea maacutes en toacutepicos de
combinatoria en la certeza de hallar en sus meacutetodos una mejor comprensioacuten y
evaluacioacuten de sus temas de anaacutelisis Problemas de enumeracioacuten estructuras
loacutegicas probabilidades finitas optimizacioacuten y algoritmos e investigacioacuten sobre
operaciones discretas son del intereacutes de todo hombre de ciencias y la computacioacuten
juega en ellas un papel fundamental Igualmente en la teoriacutea de invariantes en la
teoriacutea de representacioacuten de grupos y grupos de Lie en la teoriacutea de funciones
simeacutetricas las reglas combinatorias explican y amplifican numerosas propiedades
que a la vez son de gran aplicabilidad en fiacutesica quiacutemica y biologiacutea
BIBLIOGRAFIacuteA
AFIFI AA and CLARK V (1996) Computer-Aided Multivariate Analysis
Third Edition Texts in Statistical Science Chapman and Hall
BOXG E P HUNTER W G HUNTER JS (1978) Statistics for
Experimenters John Wiley amp Sons
BOX G HUNTER W amp HUNTER JS Estadiacutestica para Investigadores
Introduccioacuten al Disentildeo de Experimentos Anaacutelisis de Datos y Construccioacuten de
Modelos Ed Revertsbquo SA
Cao R y otros (2002) ldquoIntroduccioacuten a la Estadiacutestica y sus aplicacionesrdquo Ed
Piraacutemide
Calderoacuten C Bernardo A (2009) ldquoMeacutetodos de estimacioacuten
(httpsionaudeaeduco~bcalderon3_metodosestimacionhtml)rdquo Estadiacutestica
Matemaacutetica I Universidad de Antioquia
Camacho Rosales J (1998) Estadiacutestica con SPSS para Windows Ra-Ma
Madrid
Castantildeeda J J(1991) Meacutetodos de Investigacioacuten 2 Editorial McGraw-Hill
Meacutexico
Carono R Minujin A y Vera G(1982) Manual de teacutecnicas de evaluacioacuten
yajuste de informacioacuten Estadiacutesticas Fondo de cultura econoacutemica Meacutexico
Chao L(1993) Estadiacutestica para la Ciencia Administrativa Editorial McGraw
ndashHill 4ta Edicioacuten Colombia
CHOU YA-LUN (1972) Anaacutelisis Estadiacutestico Editorial Interamericana
Meacutexico
COCHRAN WG amp COX GM Disentildeo Experimentales Ed Trillas
COX DR (1958) Planning of experiments New York John Wiley amp Sons
DANIEL C Applications of Statistics to Industrial Experimentation Willey
DAVIES OL The Design and Analysis of Industrial Experiments Hafner
(McMillan)
DANIEL WAYNE W y Otros (1993) Estadiacutestica con Aplicacioacuten a las Ciencias
Sociales y a la Educacioacuten Editorial McGraw-Hill Interamericana de Meacutexico
SA de CV Meacutexico
De Oteyza de O E Emma Lam O Carlos Hernaacutendez G y Aacutengel M Carrillo H
(1998) Temas Selectos de Matemaacuteticas Prentice Hall Meacutexico
Enciclopedia Microsoft Encarta 2003 (2003) Censo- Cuestionario- Encuesta
Estadiacutestica Editorial Microsoft corporation USA
ERKIN KREYSZIA (1978) Introduccioacuten a la Estadiacutestica Matemaacutetica Editorial
Limusa SA Meacutexico
EVERITT B And GRAHAM D (1991) Applied Multivariate Data Analysis
Arnold
FEDERER W (1965) Experimental design Oxford Publ Co
GARCIacuteA J amp LARA A Disentildeo Estadiacutestico de Experimentos Anaacutelisis de la
Varianza Grupo Editorial Universitario
FERRAN M (1997) SPSS para Windows Programacioacuten y Anaacutelisis Estadiacutestico
McGraw Hill
FREUD J E y Otros (1990) Estadiacutestica para la Administracioacuten con Enfoque
ModernoEditorial SA Meacutexico
George C Canavos (1988) ldquoProbabilidad y Estadiacutestica ndash Aplicaciones y
Meacutetodosrdquo Ed McGraw-Hill
GILL JL (1978) Design and Analysis of Experiments in the Animal and
Medical Sciences Iowa State University Press
JOBSON J D (1991) Applied Multivariate Data Analysis Vol I Regression
and Experimental Design Springer-Verlag
Gomes Rondoacuten Francisco (1985) Estadiacutestica Metodologica Ediciones Fragor
Caracas
GONDAR NORES JE (2002) Tomo D Estadiacutestica Multivariante Data Mining
Institute
GONDAR NORES JE (2001) Tomo M Investigacioacuten de Mercados Data
Mining Institute
Gonzaacutelez Nijad H (1986) Meacutetodos estadiacutesticos en Educacioacuten Editorial
Bourgeoacuten Caracas
Guilford J Y Fruchter B (1984) Estadiacutestica aplicada a la Psicologiacutea y la
EducacioacutenEditorial McGraw-Hill Latinoamericana S A Bogotaacute
Hamdan Gonzaacutelez Nijad (1986) Meacutetodos Estadiacutesticos en Educacioacuten Editorial
BourgeoacutenCA Caracas ndash Venezuela
HAIR J ANDERSON R TATHAM R y BLACK W (1999) Anaacutelisis
Multivariante 5ordf Edicioacuten Prentice Hall
JOBSON JD (1992) Applied Multivariate Data Analysis Volume II
Categorical and Multivariate Methods Springer-Verlag
KEVIN RICHARD I (1988) Estadiacutestica para Administradores Editorial
Hispanoamericana Meacutexico
KIRK RE Experimental Design Procedures for the Behavioral Sciencies
BrooksCole Publishing Company
LARSON HAROLD J (1985) Introduccioacuten a la Teoriacutea de Probabilidades e
inferencia Estadiacutestica Editorial Limusa Meacutexico
LEHMANN CHARLES H (1995) AacuteLGEBRA Editorial limusa SA DE CV
Grupo Noriega Editores Meacutexico
LEITHOLD LOUIS (1992) El Caacutelculo con Geometriacutea Analiacutetica Editorial
HARLA Meacutexico
LINCON L CHAO (1996) Estadiacutestica para Ciencias Administrativas Cuarta
edicioacuten Editorial McGaw-Hill Usa
Lenin Ry Kubin D(1992) Estadiacutestica para Administradores Editorial
Hispanoameacuterica VI edicioacuten Meacutexico
LEBART L MORINEAU A and PIRON M (2000) Statistique Exploratoire
Multidimensionnelle 3ordf Edition DUNOD
LOPEZ CASUSO R (1984) Introduccioacuten al Caacutelculo de Probabilidades e
Inferencia Estadiacutestica Editorial Instituto de Investigaciones Econoacutemicas UCAB
Caracas- Venezuela
LORENZEN T J Anderson V L (1993) Design of experiments A No-Name
Approach Marcel Dekker Inc
Manzano V y otros (1999) SPSS para Windows Ra-Ma Madrid SPSS Inc
(1999) SPSS 90 Manual de Usuario SPSS Chicago
MARDIA KV KENT JT y BIBBY JM (1994) Multivariate Analysis
Academic Press
Enfocados hacia SPSS
Martiacutenez E Andreacutes G Introduccioacuten al SPSS Curso de
wwwspssparatodoscom 2005
MARTINEZ ARIAS R (2000) El Anaacutelisis Multivariante en la Investigacioacuten
Cientiacutefica Cuadernos de Estadiacutestica Editorial La Muralla
Mason Robert (1992) Estadiacutestica para la Administracioacuten y Economiacutea
Ediciones Alfaomega SAN Meacutexico
MASON RL Statistical Design and Analysis of Experiments with Applications
to Engineering and Science John Wiley amp Sons New York
MENDENNAF W y OTROS (1981) Estadiacutestica para Administradores y
Economiacutea Editorial Iberoamericana Meacutexico
MEAD R CURNOW RN y HASTED AM (1993) Statistical Methods in
agriculture and experimental biology Second edition Chapman amp Hall
MONTGOMERY DC (1991) Disentildeo y Anaacutelisis de experimentos Grupo
Editorial Iberoameacuterica
MONTGOMERY DC (1994) Applied Statistics and Probability for Engineers
John Wiley amp Sons
Mode Elmer B (1988) Elementos de Probabilidades y Estadiacutestica Editorial
Reverte Mejicana Meacutexico
Murria R(1993) Estadiacutestica Edicioacuten Interamericana2da
Edicioacuten Meacutexico
Murray R Spiegel (2002) Estadiacutestica Segunda Edicioacuten Serie Schaum Mc
Graw Hill
PARZEN E (1986) Teoriacutea Moderna de Probabilidades y sus Aplicaciones
Editorial Limusa Meacutexico
NETER J et al Applied Linear Statistical Models Regression Analysis of
Variance and Experimental Designs Library of Congress Cataloging Publication
Data
OLLERO J Garciacutea J LARA A MARTIacuteNEZ A RODRIacuteGUEZ C amp
RAMOS H (1997) Disentildeo y Anaacutelisis Estadiacutestico de Experimentos Grupo
Editorial Universitario
PENtildeA SANCHEZ DE RIVERA D Estadiacutestica Modelos y Meacutetodos Modelos
Lineales y Series Temporales Vol 1 y 2 Alianza Editorial
Peacuterez L Ceacutesar Meacutetodos Estadiacutesticos Avanzados SPSS Thomson Editores
Spain SA Espantildea 2005
PUGACHEV V S (1973) Introduccioacuten a la Teoriacutea de Probabilidades Editorial
Mir Moscuacute
RAYBILL FA An introduction to Linear Statistical models Vol 1 Ed
McGraw-Hill
Rivas Gonzaacutelez Ernesto(1980) Estadiacutestica General Ediciones de la Biblioteca
UCV Caracas ndash Venezuela
RUIZ MAYA L Meacutetodos Estadiacutesticos de Investigacioacuten INE
Rodrigo Mariacutea F Molina J Gabriel (2010) ldquoTema 3 Estadiacutestica Inferencial en
Psicologiacuteardquo p 1
SHARMA S (1998) Applied Multivariate Techiques John Wiley and Sons
Soto Negrin Armando (1982) Iniciacioacuten a la estadiacutestica Editorial Joseacute Marti
Caracas ndash Venezuela
Stephen P Shao (1986) Estadiacutestica para Economistas y Administradores
deEmpresaEditorial Herreros Hermanos Sucs SA Meacutexico
Stevenson William(1991) Estadiacutestica para la Administracioacuten y Econoacutemica
Editorial Harla Meacutexico
STEEL RGD y TORRIE JH(1988) Bioestadiacutestica Principios y
procedimientos Segunda edicioacuten McGraw Hill
SIEGEL S Estadiacutestica no parameacutetrica Ed Trillas
Universidad Nacional Experimental ldquoSimoacuten Rodriacuteguezrdquo (1983) Estadiacutestica 1
Ediciones UNESR Caracas
URIEL E (1995) Anaacutelisis de Datos Series temporales y Anaacutelisis Multivariante
Coartiacuteculo Plan Nuevo Editorial AC
VISAUTA B (1998) Anaacutelisis Estadiacutestico con SPSS para WINDOWS (Vol II
Anaacutelisis Multivariante) Mc-Graw Hill
Visanta V Bienvenido Anaacutelisis Estadiacutestico con SPSS para Windows
Volumen I Estadiacutestica Baacutesica Ediciones Mc Graw Hill Segunda Edicioacuten Espantildea
2002
WALPOLE R y Myers R (1987) Probabilidad y Estadiacutestica para Ingenieros
Editorial Interamericana Meacutexico
Wackerly Dennis D Mendenhall William Scheaffer Richard L (2002) ldquo8
Estimacioacutenrdquo Estadiacutestica matemaacutetica con aplicaciones (6ordf edicioacuten)rdquo Cengage
Learning Editores p 364 ISBN 9706861947
Webster Allen L (1996) Estadiacutestica Aplicada a la Empresa y la Economiacutea
Editorial Irwin Segunda edicioacuten Barcelona ndash Espantildea
Weimer Richard C (1996) Estadiacutestica Compantildeiacutea Editorial Continental SA de
CV Meacutexico
Wonnacott T H y Wonnacott R J (1989) Fundamentos de Estadiacutestica para
Administracioacuten y Economiacutea Editorial LIMUSA Meacutexico
DIRECCIONES DE INTERNET QUE PUEDE CONSULTAR
httpesmwikipediaorgwikiSPSS
httpwwwbuenastareascomensayosque-es-el-SPSS1465478html
httpwwwbi-spaincomarticulo54399spsscaracteristicas-y-funcionalidades-
del-software-estadistico-integral-spss-base-160
httpesanswersyahoocomquestionindexqid=20070727073908aatuamw
httpwwwslidesharenetleticiagpestructura-de-spss-3126476
httpwwwehowenespanolcomprograma-spss-sobre_48697
httpwwwugres~bioestmedicinamanual_spsspdf
httpwwwmonografiascomtrabajos12tutortutorshtml
httpwwwspsscom
wwwspssparatodoscom
httpasesorspssblogspotcom200604una-de-las-ventajas-de-la-versin-130html
httpwwwspssfreecomcapitulotreshtml
httpwwwuvesRELIEVEemail relieveuves
httpwwwscribdcomdochellipspss-introduccioacuten
httpeswikipediaorgwikiSPSS
httpwwwsuperiordepsicologiacomarchivosescmanual_spss_13_espanolpd
f
httpwwwspsscomaressuccessargentinashtml
httpeswikipediaorgwikiSPSS
httpwww-01ibmcomsoftwareesanalyticsspss
httppsicofcepurvesspssindex0htm
httpssitesgooglecomsiteestadisticaconelspss
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpe-stadisticabioucmesweb_spssindice_spsshtml
httpwwwquimicaurvesquimiogeneralanovacastpdf
httpwwwucmesinfosocivmytpaginasD_departamentomaterialesanalisis_da
tosyMultivariable14anova1_SPSSpdf
httpwwwpucpredufacultadejavilesED2080020PDF20FilesED20800
20AnE1lisis20de20Varianzaspdf
httpasesoriasspssblogspotcom200908como-hacer-una-correlacion-de-
pearson
httpfcmensuabcmx~cheloestadisticadoc-pdflec-8-2-1pdf
httpwwwuoceduin3emathdocsRegresionLinealpdf
httpeswikipediaorgwikiRegresiC3B3n_lineal
httpwwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRES
ION_LINEAL_CON_SPSSpdf
httpwwwcicmaunaaccrCICMA2008REPOSITORIOREGRESION20LIN
EAL20SIMPLE20CON20SPSSpdf
httpswwwuclmesprofesoradoraulmmartinEstadisticaPracticasSPSSREGRE
SION_LINEAL_CON_SPSSpdf
httpwwwscehuessbwebfisicacursoJavanumericoregresionregresionhtm
httpeswikipediaorgwikiNivel_de_medida
httphtmlrincondelvagocomregresion-lineal-simplehtml
httpwwwdmubaarmateriasestadistica_Q20111clase20regresion20simp
lepdf
httpwwwvitutorcomestadisticabi8html
httpswwwuamespersonal_pdieconomicassgarciaregresionlinealsimplepdf
httpwwwrcumariacristinacomwp-contentuploads20101211-Elena-
Martinez_1pdf
httpwwwmonografiascomtrabajos27regresion-simpleregresion-simpleshtml
httpesslidesharenetpatolinkecuacin-de-regresin-lineal
httpeswikipediaorgwikiMC3ADnimos_cuadrados
httpeswikipediaorgwikiMC3ADnimos_cuadrados_ordinarios
httpwwwwordreferencecomdefinicioncorrelaciC3B3n
httpwwwditutorcomestadistica_2correlacion_estadisticahtml
httpeswikipediaorgwikiCoeficiente_de_correlaciC3B3n_de_Pearson
httpeswikipediaorgwikiCoeficiente_de_determinaciC3B3n
httpeswikipediaorgwikiMatriz_de_correlaciC3B3n
httpeswikipediaorgwikiAnC3A1lisis_de_la_varianza
httpwwwinfecepiunizares
httpwwwltbioestadisticaumaes
httpwwwuaqmxmatematicasestadisticasxu3html
httpwwwmembers-americastripodcom
httpwwwmsiplceorg
httpwwwbnvcocrsesionnotaaspg
httpwwwaltavistacom
httpwwwauyantepuycom
httpwwwinees
httpwwwudeccl
httpwwwrincondelvagocom
httpwwwmonografiascom
httpwwwfestadisticafguamesindicadoresiprihtml
httpwwwuaqmxmatematicasestadisticaxu3html
httpwwwinegoboiwd0801htmlE
httpwwwitlppuacuteblicaedumxtutorialeseconomia2portadahtm
httpwwwitlpedumx
httpwwweclaevespanovestadisticasna93nnsnann7eshtml
httpw3moritesmmx~cmendozamaestestoohtml
httpwwwmtyitesmmxdatamaterialesestadisticaALFREDOhtml
httpwwwuaqmxmatematicasestadisticaxtrahtmlfuncion
httpwwwunleduarfaveseiencuestasindexhtml
httpwwwmonografiascomtrabajos11operaoperashtml
httpwwwmonografiascomtrabajos6hisohisoshtml
httpeswikipediaorgwikiHistoria_de_los_sistemas_operativos
httpwwwmonografiascomtrabajos16sistema-operativosistema-
operativoshtmlTIPPOS
httpwwwtaringanetpostsciencia-educacion10684779Tipos-de-Sistemas-
operativoshtml
httpwwwmonografiascomtrabajos7sisinfsisinfshtmlei
httpwwwmonografiascomtrabajosanaydisesisanaydisesisshtml
httphamletyelaprendizajevirtualjimdocominformC3A1ticasistema-
operativo
httpwwwsliderharenetisa06tcaracteriacutesticasndashde-software
httpwwwsscccoclinformaticaconceptoshtml
httpwwwopinionynoticiascom8565-software-libre-en-el-pais-se-nutr
httpwwwcadcommxhistoria_de_la_computacionhtm
httpwwweswikipediaorgwikiBus_(informC3A1tica)
httpwwwcavsicompreguntasrespuestasque-es-un-monitor-o-pantalla
httpwwwcavsicompreguntasrespuestasque-es-el-teclado
httpwwwinfo-abuclmeslabelecSolarelementos_del_pctiposhtm
Recommended