Universidad de Costa Rica
Escuela de Estadística
XS-3510 Principios de Diseños Experimentales
“Agentes microbiológicos, patógenos y contaminantes químicos en el agua superficial de
la Microcuenca del Río Purires, Cartago”
Solicitado por:
Prof. Álvaro Castro
Elaborado por:
Oscar Mario Carmona Arguedas B01345
Sergio Cubero Soto B02035
Melissa Valverde Hernández A86571
Ciudad Universitaria Rodrigo Facio
Martes 3 de julio de 2012
Introducción
En el presente proyecto “Agentes microbiológicos, patógenos y contaminantes
químicos en el agua superficial de la Microcuenca del Río Purires, Cartago”. Se investigará,
bajo el análisis estadístico, los diferentes organismos microbiológicos y fisicoquímicos que se
encuentran presentes en la cuenca del Río Purires, en los diferentes puntos o zonas donde se
tomaron las muestras respectivas para efectuar el estudio; y evidenciar si hay diferencias entre
ellos para detectar la contaminación en el agua superficial de la Microcuenca del Río Purires.
Para la realización de este proyecto, se trabajó conjuntamente con el Instituto de
Investigaciones en Salud (INISA). El INISA de la Universidad de Costa Rica, es una unidad
académica multidisciplinaria dedicada a la investigación en el campo de la salud humana y de
las ciencias afines.
Además, es importante mencionar que los investigadores del INISA realizan los
análisis microbiológicos en el Laboratorio de Microbiología de Alimentos y Aguas del INISA,
y se basan en la edición 20 (Año 1999) del Standard Methods for the Examination of Water
and Wastewater de la APHA. Además, los análisis fisicoquímicos se realizarán en el
Laboratorio de Calidad de Aguas del CICA siguiendo los Métodos de Análisis Químico
Ambientales (MAQA), acreditados por la norma INTE ISO IEC 17025:2005. Los MAQA
están basados en la edición 21 (Año 2005) del Standard Methods for the Examination of
Water and Wastewater de la APHA.
Para el muestreo, se realizó de acuerdo con los protocolos con los que cuenta el CICA
y que están dentro del alcance de la acreditación de los ensayos bajo la norma INTE ISO IEC
17025:2005.
Además, en el proyecto se explicará diferentes pruebas estadísticas para cuando se
presenta la heterocedasticidad en las variables donde se proceda realizar algún análisis
experimental. Finalmente, se expondrá las pruebas no paramétricas para comparaciones
múltiples como la prueba de Dunn y prueba de Suma Rangos de Wilcoxon.
Objetivos
I. Determinar las diferencias entre los puntos de toma de las muestras de la Microcuenca
del río Purires, mediante análisis de microrganismos específicamente como los
Coliformes fecales, la Escherichia coli, los Enterococcus fecalis, y de los elementos
físico químicos como el pH, la demanda bioquímica de oxígeno y el nitrato.
II. Analizar los aspectos de las diferentes pruebas paramétricas y no paramétricas
utilizadas en caso de heterocedasticidad de las variables en diseños experimentales
balanceados y desbalanceados; así como las pruebas de comparación múltiples no
paramétricas.
Justificación del proyecto
Actualmente, las actividades humanas producen un impacto directo al medio ambiente,
de tal manera que se hace necesario realizar investigaciones y estudios que nos den a conocer
las consecuencias de estas acciones humanas en los recursos naturales.
En el medio ambiente se encuentran recursos naturales sumamente importantes para la
vida, un recurso esencial en la vida biológica es el agua. El agua es uno de los recursos más
vulnerables ante la contaminación ambiental. Como es un recurso necesario para los seres
vivientes, en particular para los seres humanos, inevitablemente la salud pública de las
personas se encuentra afectada.
Por tanto es importante analizar y determinar las variables microbiológicas (presencia
de microrganismos patógenos) y químicas (contaminantes tóxicos), que explican la calidad del
agua. Además, es pertinente conocer las correlaciones de estas variables con respecto a las
actividades que se desarrollen en una zona específica.
Este proyecto de investigación se estudiará un área importante para la detección de
contaminación microbiológica y química, lo constituye precisamente la microcuenca del Río
Purires, ubicada en la provincia de Cartago. Esta microcuenca pertenece a la cuenca del Río
Reventazón-Parismina que drena a la Vertiente Atlántica, que en conjunto con la cuenca del
Río Tárcoles, constituyen las dos principales cuencas del país, donde se ubica el 70% de la
población y reciben las aguas residuales sin tratar provenientes del Gran Área Metropolitana.
Se han realizado algunos estudios que han demostrado que el agua de la microcuenca
en su parte alta, tiene una calidad de buena a regular, el principal aporte de contaminantes son
los sedimentos, provenientes del efecto de erosión sobre los suelos. El segundo aporte de
contaminación es la materia fecal y las aguas jabonosas provenientes de la población
localizada en su parte alta. No obstante, el agua fluye con características de calidad inolora,
incolora y con baja turbiedad.
Es por eso que en el estudio como se mencionó anteriormente, se localizaron tres
puntos o zonas de la microcuenca del Río Purires, en donde se tomaron tres muestras
mensuales en cada una de las tres zonas de la Microcuenca. Estas zonas fueron determinadas
de la siguiente manera, una primera zona donde se encuentra la parte alta de la micro cuenca,
una segunda zona donde se presenta un uso agrícola y una tercera zona donde se realiza una
actividad urbana y un uso industrial. Es por eso que en el proyecto es importante observar que
microrganismos y que factores fisicoquímicos se encuentran presentes en el agua con respecto
a cada zona.
Definición de Variables:
Variables Respuesta:
Los datos de los diferentes agentes microbiológicos así como los elementos químicos
encontrados en el agua sustraída de la microcuenca, serán utilizadas como variables respuesta
para el análisis estadístico del proyecto.
Las variables microbiológicas son las siguientes:
Coliformes totales y coliformes fecales:
El grupo de coliformes ha sido definido basado en relaciones bioquímicas y no
genéticas. Los géneros Citrobacter, Enterobacter, Klebsiella y Escherinchia son los
denominados coliformes totales, y solamente el género Escherinchia es denominado el grupo
coliformes fecales. Estos grupos se utilizan como índices de contaminación fecal debido a que
son muy frecuentes en heces, son fáciles de detectar en el laboratorio, además en algún
aspecto pueden relacionarse a patógenos causantes de enfermedad en el ser humano. Es
importante resaltar que los coliformes fecales tienen significado sanitario, por lo que son los
que más interesan en el análisis microbiológico de alimentos (Arias, et al. 2008; Pascual, et al.
2000).
La técnica utilizada para el análisis de coliformes totales y fecales en agua es la de
Número más probable (NMP). Esta es una técnica estadística indirecta que da un estimado de
la población y no identifica una especie en particular, y el número de microrganismos
obtenidos se reporta en NMP/mL (Arias, et al. 2008).
Escherinchia coli (E. coli):
Escherinchia coli pertenece a la familia Enterobacteriaceae, el cual es parte de la flora
normal del tracto gastrointestinal del ser humano y de otros animales. Aunque la mayoría de
E. coli no causan enfermedad gastrointestinal, algunos grupos pueden causar diarrea y
secuelas severas o discapacidad (Meng, et al. 2001). La técnica utilizada para determinar esta
bacteria en agua es NMP.
Enterococcus faecalis (E. faecalis):
La gran importancia de los enterococcus radica en que compartir con otras bacterias
sus genes de patogenicidad. Además esta bacteria es cada vez más estudiada con mayor interés
debido a que son una importante causa de infecciones intrahospitalarias y son de muy difícil
tratamiento por su amplia resistencia a antibióticos (Forbes, et al. 2009). La técnica utilizada
para determinar esta bacteria en agua es NMP.
Para la detención de esta bacteria se desarrolla una prueba presuntiva y una
confirmatoria. La presuntiva se realizará para determinar crecimiento microbiano en medios
selectivos, incubados a 35ºC por 24 horas, y la confirmatoria, permitirá detectar la presencia
específica del microrganismo de interés.
Las variables fisicoquímicas son las siguientes:
El pH :
Se puede definirse como una medida que expresa el grado de acidez o basicidad de una
solución en una escala que varía entre 0 y 14 . Además, la acidez aumenta cuando el pH
disminuye. Una solución con un pH menor a 7 se dice que es ácida, mientras que si es mayor a
7 se clasifica como básica. Una solución con pH 7 será neutra. También los cambios en la
acidez o el pH pueden ser causados por la actividad propia de los organismos, deposición
atmosférica (lluvia ácida), características geológicas de la cuenca y descargas de aguas de
desecho (Goyenola, 2007).
El instrumento de medición del pH es un con potenciómetro calibrado, además como
unidad de medida se tendrá el pH a una temperatura 20,0 ºC.
Detección bioquímica de oxígeno:
La demanda o detección bioquímica de oxígeno se puede definir como la “medida de la
cantidad de oxígeno requerido para degradar la materia orgánica de una muestra de agua, por
medio de una población microbiana heterogénea. La información obtenida en la prueba
corresponde a la materia orgánica biodegradable.” (León, C. 2009). Esta se mide en
miligramos de oxígeno diatómico por litro (mgO2/l).
Esta prueba es, generalmente utilizada para el estudio de contaminación en aguas
residuales, municipales e industriales. Es importante realizar esta medición ya que permite
calcular los efectos de las descargas de desechos domésticos e industriales sobre la calidad de
las aguas. Los datos de esta prueba son utilizados para el diseño de plantas de tratamiento de
aguas residuales.
Para la medición de la detección bioquímica de oxígeno, se realiza el método por
incubación a 20,0ºC durante 5 días; se mide la concentración de oxígeno al inicio y al final del
período, con un electrodo selectivo.
Nitrato:
Se define como la sal formada por la combinación del ácido nítrico con una base que
puede ser amonio, potasio, sodio, de Chile. (RAE, 2012).
La concentración de nitratos de origen natural en las aguas es de unos pocos
miligramos por litro. El aumento de concentraciones de este elemento químico tiene la causa
directa en determinadas prácticas agrícolas, ya que los agricultores vierten grandes cantidades
de abonos nitrogenados en los campos para poder mantener una producción adecuada e
incrementar las cosechas, la mayoría de los cuales no son absorbidos por las plantas ni por los
árboles, sino que se depositan en el suelo y, o bien van filtrándose hacia capas
progresivamente más profundas hasta que se concentran en las capas freáticas, es decir,
aquellas capas más superficiales de los acuíferos que son susceptibles de ser explotadas
mediante pozos, o bien por escorrentía llegan hasta las aguas superficiales (Blancas, C 2001).
Al ser captadas estas fuentes hídricas y ser trasladadas para consumo de los seres
vivos, la presencia de este nitrato puede dar como resultado diferentes enfermedades
peligrosas y mortales especialmente para la salud humana. La unidad de medida del nitrato es
mg NO3-/L.
Factor tratamiento:
Como factor tratamiento se analizará los diferentes puntos donde se tomaron las
muestras de la Microcuenca del Río Purires. Estos datos se recolectaron de acuerdo a los
protocolos con los que cuenta el CICA y que están dentro del alcance de la acreditación de los
ensayos bajo la norma INTE ISO IEC 17025:2005. En estos tres diferentes puntos, se tomaron
tres muestras de cada punto mensualmente durante la época lluviosa y seca.
Estos son tres puntos diferentes son:
Zona alta: ubicada en la zona alta de Cartago cerca de la naciente del río. Esta abastece
el Acueducto Rural de El Guarco, de modo que esta zona es susceptible a la contaminación
microbiológica y química.
Zona de uso agrícola: en esta zona se localizan la mayoría de las producciones
agrícolas de la zona, siendo las más importantes las plantaciones de plantas ornamentales
(como flores o helechos para exportación) cultivados bajo invernaderos. Estas plantaciones se
ubican en las zonas bajas de la micro cuenca. También se presenta en la zona, principalmente
en las partes bajas de Tablón, Tobosi, Barrancas y Guatuso las plantaciones de caña,
legumbres y hortalizas. Además se realizan concesiones mineras alrededor de Coris, Bermejo
y Guatuso. El área total de esta zona agrícola y minera es de 11,9%.
Zona de uso urbano: El uso urbano ocupa 5 949 km2 del lugar. Estos se ubican cerca
de la zona industrial y la mayor concentración de población en la zona. Estos asentamientos
generan múltiples descargas de desechos y la contaminación de la microcuenca.
Cabe destacar que la mayoría de la zona (el 67.5% de la superficie de la micro-cuenca)
está cubierta por pastos y sectores reforestados. Además los bosques así como la Zona
Protectora de la Carpintera se ubican en las zonas altas, especialmente en las nacientes de los
ríos.
Aspectos importantes
En el presente proyecto, para la decisión de rechazo o aceptación de las pruebas se
utilizará un alfa de 0,05. Se utilizarán los programas estadísticos R Cran.
Elección del diseño experimental
En las investigación se desarrolló un diseño experimental el cual consiste en un análisis
de un solo factor, para cada de las variables de respuesta, explicada por los tres puntos.
Tratando de determinar la cantidad de microrganismos microbiológicos y fisicoquímicos que
se encontraba en cada punto, para luego realizar una comparación entre ellos.
Se ajusta al problema pues se tiene un solo factor para determinar la cantidad de cada
una de las variables estudiadas, en este caso es el punto de muestreo.
Análisis Estadístico
Para la investigación de la cuenta de del Río Purires, se procedió a analizar los datos
de las diferentes muestras. Para ello los investigadores del INISA tomaron mensualmente tres
muestras en cada uno de los tres puntos de la Microcuenca, durante la época seca y lluviosa, a
partir del 2010. Finalmente, se lograron tomar 108 muestras.
Para cada muestra se analizó un perfil microbiológico como la presencia de agentes
virales como los colifagos, patógenos bacterianos como coliformes totales ,coliformes fecales,
Escherichia coli, Eneterococcus fecalis, Enterococcus sp., Pseudomonas aeruginosa,
Staphylococcus aureus, Colifagos somáticos y Colifagos f+, y un perfil fisicoquímico
completo como demanda biológica de oxígeno o DBO, demanda química de oxígeno o DQO,
sólidos en suspensión, amonio, ph, demanda de oxigeno; metales como cadmio, plomo,
níquel, zinc, cromo, arsénico y un no metales como fósforo y nitrato. Y algunos físicos como
la conductividad y temperatura.
Inicialmente, se tiene ocho microbiológicos y dieciséis fisicoquímicos. Pero se realizó
una selección microbiológicos como coliformes fecales, Eneterococos fecalis y Escherichia
coli; y tres fisicoquímicos como demanda biológica de oxígeno, pH y nitrato.
Para la investigación se optó realizar un análisis de varianza por cada variable de
respuesta con respecto a cada punto de muestreo. Primeramente, se realizó la verificación de
supuestos de las variables, además es importante mencionar que las muestras en cada punto
son independientes.
Análisis de cada variable de respuesta
Primeramente se realizó una investigación preliminar en cada una de las variables, en
la cual se realizaron gráficos. En consecuencia de ese análisis preliminar, en las diferentes
variables tanto microbiológicas como los fisicoquímicos se encontraron valores extremos, en
este caso se le comunicó a los investigadores del proyecto, donde ellos tomaron las decisiones
pertinentes para seguir con el análisis de las variables.
Finalmente, para cada variable se tomaron diferentes medidas remediales para
minimizar los diferentes problemas que se presentaban en las variables, en donde no se
cumplieron los supuestos para realización del análisis de variancia (ANDEVA).
Gráfico 1. Matriz de gráficos de caja por cada variable vrs punto
1 2 3
0e+0
01e
+05
2e+0
53e
+05
4e+0
55e
+05
Coliformes Fecales vrs Punto
Puntos de Muestreo
Col
iform
es F
ecal
es
1 2 3
050
000
1000
0015
0000
E Coli vrs Punto
Puntos de Muestreo
E C
oli
1 2 3
050
000
1000
0015
0000
Enterococcus Fecales vrs Punto
Puntos de Muestreo
Ent
eroc
occu
s F
ecal
es
1. Microbiológicos .
Para cada variable se realizo un análisis de inspección grafica para identificar los
posibles problemas que podía tener, así como de la distribución de las variables por cada
punto, a continuación se muestra un grafico de cajas por cada variable.
Fuente: INISA
En el figura 1 se observa que las tres variables presenta problemas de valores
extremos, además también se logra distinguir problemas de heterocedasticidad (varianza
desigual de los residuos) esto debido a que conforme se pasa del punto 1 al 2 y del 2 al 3
aumenta la variabilidad de dichas variables, para poder confirmar dichos problemas se acudió
a los gráficos de los residuales para evaluar los supuestos de la prueba de analisis de varianza,
los supuestos para que este analisis tenga validez son los siguientes: los residuos se distribuyen
normal, además tienen varianza igual (homocedasticidad), por otro lado se sabe de ante mano
que se cumple el supuesto de que las observaciones son independientes. (Ver anexos Figuras
1,2 y 3)
En los gráficos de evaluación de supuestos se observa que en el gráficos de residuales
contra valores predichos que no existe igualdad de varianza de los residuos debido que se
observan patrones en forma de megáfono, dado esto concluimos que no se cumplen el
supuesto de homocedasticidad en ninguna de las variables microbiológicas. Por otro lado en
los gráficos de probabilidad normal se observan gran cantidad de valores extremos en toda las
variables, estos valores causan el no cumplimiento del supuesto de normalidad, así mismo se
confirma que estos tienen influencia sobre el analisis de varianza por lo tanto pueden
concluirse que son valores atípicos los cuales se deben corregir puesto que estos pueden ser
los causantes de la heterocedasticidad y de la violación del supuesto de normalidad.
Se realizaron diversas medidas remediales como transformaciones pero no se logro
corrección algún, debido a estos hubo diversas reuniones con el encargado de la investigación
para saber que decisión tomaban ellos para tratar este tipo de valores, se llego a la conclusión
de que se eliminaran las 18 primeras observaciones referentes a los meses de setiembre y
octubre del año 2011, esto debido a que en estos meses se presento un problemas en el
laboratorio con el analisis de las muestras tomadas en el rio. También se decidió como medida
remedial obtener un promedio de cada punto sin los valores extremos, y sustituir los valores
extremos de cada punto por su promedio correspondiente. Luego realizar todas estas acciones
se volvió a realizar la evaluación de supuestos para ver si se habían corregido.
Ante esto se analizara cada variable respuesta por separa debido a que a cada una de
ellas se realizo una medida remedial particular.
Coliformes Fecales
Como se menciono antes se realizo un procedimiento el cual fue sustituir los valores
extremos por el promedio del punto de muestra sin dichos valores, después de esto se procedió
a realizar la inspección grafica del cumplimiento de los supuesto.
Gráfico 2. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos
Fuente: INISAComo se visualiza en el Gráfico 2, los problemas heterocedasticidad, falta de
normalidad no se corrigen y por el contrario con la corrección de los valores extremos lo que
sucede es que aparecen nuevos valores extremos por lo tanto se vuelve a realizar de nuevo la
corrección de valores extremos saldrán nuevos valores lo cual presenta un problema el cual no
tendría fin. Dado esto se decide volver a probar con una trasformación. La transformación que
surge efecto según el método de box cox es el logaritmo natural. A continuación se mostrara
la evolución de supuestos con dicha transformación.
Gráfico 3. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos y la transformación
ln
Fuente: INISA
Con la transformación se ve claramente en el grafico de residuales contra valores
predichos que corrige el problema de heterocedasticidad, así como los problemas de valores
atípicos puesto que todos los valores se encuentran entre -3 y 3 desviaciones estándar. (Ver
grafico de residuos estandarizados contra los puntos de muestra). Uno de los supuestos donde
no hay completa seguridad de afirmar que se cumpla por medio del analisis grafico es el de
normalidad, por lo tanto se recurre la prueba formal de normalidad de Shapiro-Wilk, dicha
prueba nos confirma que los residuos se distribuyen normal. (P-value 0,112>0,05)
Salida 1. Prueba de normalidad Shapiro Wilk Shapiro-Wilk normality test
Data: modln$residuals
W = 0.9771, p-value = 0.112
Dado que ahora se tiene plena seguridad que la variable transformada cumple los
supuestos para la realización del analisis de varianza se procedió a realizar dicho analisis el
cual se muestra en la siguiente tabla.
Tabla 1. Analisis de varianza, variable coliformes fecales
gl SC CM F Valor pPunto 2 205.32 102.66 154.3 <2e-16 ***
Residuos 87 57.88 0.67Total 89 263.20 2.96Fuente: INISA
De acuerdo con el analisis de varianza anterior se puede concluir con una confianza del
95% que hay suficiente evidencia estadística para rechazar que los puntos de muestra son
iguales, esto pues el valor p es menor al nivel de significancia (p-value 2e-16<0,05).
Partiendo de que hay diferencias entre los puntos es importante realizar comparaciones
múltiples entre los puntos para saber cual(es) punto(s) son los diferentes, para identificar estas
diferencias se opto por utilizar la prueba de comparaciones múltiples de medias de Tukey la
cual se muestra a continuación.
Salida 2. Prueba de comparación múltiple de medias de TukeyTukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = lncolifeca ~ pmuestra)
Diferencia
Inferior Superior p adj
2-1 2.390473 1.8883055 2.89264 0.00E+003-1 3.640708 3.1385408 4.142876 0.00E+003-2 1.250235 0.7480679 1.752403 2.00E-07
Con lo observado en la salida 2 podemos concluir que con un nivel de confianza del
95% que existen diferencias en la cantidad media de coliformes fecales en los tres puntos de la
toma de muestra.
En conclusión y con lo visto en los gráficos iniciales se puede afirmar que conforme se
desciende por la cuenca del rio Purires se encuentra mayor cantidad de coliformes fecales y
que la diferencia de un punto a otro es estadísticamente significativa. Una explicación a este
fenómeno es que el punto uno es una zona de poca actividad humana y por lo tanto los valores
de coliformes fecales son menores, en comparación con el punto dos donde se encuentra un
asentamiento urbano. Por otro lado punto tres es el que presenta valores altos de coliformes
fecales puesto que es el último punto rio abajo, en esta zona se encuentra un grupo de
industrias y además es el punto donde vienen a dar todos los residuos de las demás zonas del
rio.
Escherichia coli
Igualmente con los coliformes fecales se encontraba una violación a los supuestos (Ver
anexos Figura 2), se sustituyó los valores extremos por el promedio del punto de muestra sin
dichos valores, luego se procedió a efectuar los gráficos para el cumplimiento de los
supuestos.
Grafico 4. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos.
Fuente: INISA
Como se observa en el grafico 4, existe incumplimiento de homocedasticidad y falta de
normalidad, al igual que en coliformes fecales, no se corrige y se sigue el problema con la
corrección de los valores extremos, se descubren nuevos valores extremos. Lo cual se procede
a realizar una trasformación a la variable. Según el método de box cox la transformación
apropiada es logaritmo natural. Seguidamente se analizaran los supuestos, con la
transformación que se le realizó a la variable.
Grafico 5. Evaluación de supuestos con transformación
Fuente: INISA
Se ve en el grafico Normal Q-Q , que con la transformación logarítmica se corrige el
problema de normalidad, por lo tanto se recurre la prueba formal de normalidad de Shapiro-
Wilk, para la confirmación de dicho supuesto. Además, los valores atípicos se encuentran en
el intervalo deseado entre -3 y 3, lo cual indica que no hay problema con esos valores (Ver
grafico de residuos estandarizados contra los puntos de muestra). Con respecto a la
homocedasticidad, en el gráfico de residuales contra valores predichos se observa que
levemente le supuesto se cumple, como no hay una completa seguridad observacional en el
gráfico, se realiza la prueba formal Bartlett, ya que se cumple la normalidad de la variable.
Salida 3. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test
data: modln2$residuals
W = 0.9814, p-value = 0.2243Salida 4. Prueba de homocedasticidad Bartlett
Bartlett test of homogeneity of variancesdata: lnecoli by pmuestra
Bartlett's K-squared = 3.6341, df = 2, p-value = 0.1625
Ejecutando las pruebas formales, con la prueba Shapiro-Wilk se confirma el
cumplimiento de normalidad de la variable E. coli (p-value 0,2243>0,05). Además, se realiza
la prueba Bartlett para la igualdad de variancias, dando como resultado la aprobación del
supuesto de homocedasticidad (p-value 0,1625>0,05).
Por tanto, se tiene el cumplimiento de ambos supuestos. Ahora, se procede a ejecutar el
análisis de variancia de la variable. A continuación se presenta el resultado:
Tabla 2. Análisis de variancia, variable E. Coli
F.V. gil SC CM F Valor P
Punto 2 201.63 100.82 141.9<2e-16
***Residuos 87 61.82 0.71
Fuente: INISA
De acuerdo con el análisis de varianza descrito anteriormente, con un 95% de
confianza que hay suficiente evidencia estadística para rechazar que los puntos de muestra son
iguales, (p-value 2e-16<0,05). Como hay diferencias de la variable E. Coli entre los puntos
de muestreo, es importante ejecutar las comparaciones múltiples entre los puntos, para conocer
estas diferencias se procedió a utilizar la prueba no paramétrica de comparación de medias de
Tukey la cual se muestra a continuación.
Salida 5. Prueba de comparación múltiple de medias de Tukey
Tukey multiple comparisons of means95% family-wise confidence level
Fit: aov(formula = lnecoli ~ pmuestra)Diferenci
a Inferior Superior p adj2-1 2.403941 1.8849719 2.92291 0.00E+003-1 3.59936 3.0803906 4.118329 0.00E+003-2 1.195419 0.6764496 1.714388 1.20E-06
Se concluye con un nivel de confianza del 95% que existen diferencias en la cantidad
media de E. Coli en los tres puntos de la toma de muestra. Al igual que los coliformes fecales,
se afirma que conforme se desciende por la cuenca del rio Purires se presenta un aumento en
la cantidad de E. Coli. Además, es evidente que la diferencia de un punto a otro es
significativa.
Enterococcus Fecales
Al igual que las demás variables del área microbiológica se sustituyeron los valores
extremos por el promedio del punto de muestra sin dichos valores, para después hacer el
análisis de los residuos con el fin de observar si cumplen todos los supuestos para la
realización del ANOVA.
Como se visualiza (Ver Anexos Figura 3), se presentan problemas heterocedasticidad,
de no normalidad. Además es importante destacar que con la corrección de los valores
extremos lo que sucede es que aparecen nuevos valores extremos, este problema es el mismo
que han presentado las variables anteriores, por lo tanto se toma la decisión de realizar una
transformación, la mas adecuada para el comportamiento de los datos es el logaritmo natural,
además esta transformación se confirmo por medio de método de box cox. A continuación se
mostrara el efecto de la transformación y como esta ayuda con el problema de
heterocedasticidad.
Grafico 6. Enteroccocus fecalis, Evaluación de supuestos con la transformación
Fuente: INISA
En el grafico de residuales contra valores predichos se observa como el logaritmo
natural corrige el problema de heterocedasticidad, sin embargo la violación al supuesto de
normalidad esta latente, debido a que en el grafico de probabilidad los residuos no se ajustan a
la línea normal. Debido a la violación del supuesto normalidad se procede a realizar la prueba
no paramétrica de Kruskal Wallis la cual es la homologa del ANOVA cunado no se cumplen
el supuesto de normalidad, esta prueba se muestra en la salida 6.
Salida 6. Prueba de Suma de Rangos de Kruskal Wallis
Kruskal-Wallis rank sum testdata: lnenetefeca by pmuestra
Kruskal-Wallis chi-squared = 54.9483, df = 2, p-value = 1.17e-12
De acuerdo con esta prueba se puede concluir con una confianza del 95% que hay
suficiente evidencia estadística para rechazar que los puntos de muestra son iguales, esto pues
el valor p es menor al nivel de significancia (p-value 1.17e-12<0,05). Partiendo de que hay
diferencias entre los puntos es importante realizar comparaciones múltiples entre los puntos
para saber cual(es) punto(s) son los diferentes. Dado que se utilizo una prueba no paramétrica
se tienen que usar prueba que se concordante con la utilizada, para nuestro caso se utilizaron
dos pruebas las cuales son: la Prueba de Dunn y la Prueba de Comparaciones Múltiples de
Sumas de Rangos de Wilcoxon. Estas pruebas serán explicadas de forma breve mas adelante.
Para ambas pruebas se utilizo un nivel de significancia de 0.0166, este se obtuvo
dividendo el alfa de 0.05 entre el número de comparaciones (para nuestro caso es 3). En los
tabla 3 y 4 se muestran dichas pruebas.
Tabla 3. Prueba de Comparaciones Múltiples
Comparaciones
W P-Value
1-2 88 7.07e-08
1-3 28 3.466e-10
2-3 167.5 2.926e-05
Fuente: INISA
Tabla 4. Prueba de comparaciones múltiples de Dunn
Diferencia de los Rangos Medios
Estadístico de Prueba
-28.73 -10.79505
-20.93 -10.79505
-49.66 -10.79505
Fuente: INISA
Con lo observado en ambos cuadros con un nivel de confianza del 98.33% se puede
concluir que existen diferencias la presencia de Enterococcus fecales en los tres puntos del rio.
Este resultado ha sido una constante a lo largo de todo el análisis de las variables
microbiológicas, pues como se había explicado en las coliformes fecales esto se debe que el
punto uno es una zona de poca actividad humana en comparación con el punto dos donde se
encuentra un asentamiento urbano, y además en punto tres es el último punto rio abajo, y
sumado a esto en la zona se encuentra un grupo de industrias.
1. Fisicoquímicos
Como se mencionó anteriormente se encontraron valores extremos, al igual que las
variables microbiológicas se procedió calcular un promedio de cada punto sin los valores
extremos, y sustituir los valores extremos de cada punto por su promedio correspondiente. Al
igual que las variables microbiológicas, se volvió a efectuar la evaluación de los supuestos
para cada variable para la verificación de normalidad y homocedasticidad, y observar si los
problemas se habían corregido.
Es importante mencionar que como las variables fisicoquímicas son más estables con
respecto a las variables microbiológicas, y además no hubo ningún problema con las muestras
como sucedió en las variables microbiológicas, es por eso que en estas variables se decidió no
excluir los datos referentes a los meses de setiembre y octubre del año 2011.
Para cada variable se realizo un análisis de inspección grafica para identificar los
posibles problemas que podía tener, así como de la distribución de las variables por cada
punto, a continuación se muestra un grafico de cajas por cada variable.
Gráfico 7. Matriz de gráficos de caja por cada variable vrs punto
Fuente: INISA
Para estas variables, primeramente se realizó un análisis preliminar con los gráficos de
cajas con respecto a cada punto, esto con el fin de observar valores extremos y conocer la
variabilidad de la demanda bioquímica de oxígeno, pH y nitrato en cada punto.
En las variables fisicoquímicas, la demanda bioquímica de oxigeno y nitrato, se
observa que el supuesto de homocedasticidad se incumple, ya que la amplitud de las caja es
diferente en cada punto de muestreo. Además en la demanda bioquímica de oxigeno se notan
valores extremos, siendo posiblemente atípicos. Por el contrario en la variable nitrato, no se
hayan valores extremos en cada punto.
Específicamente en la variable pH se observa un valor extremo el punto 1, note que la
tamaño de las cajas es similar en cada uno de los punto, por lo tanto puede ser que no hay
problemas de heterocedasticidad.
Demanda bioquímica de oxigeno
Como se indicó se realizó un análisis preliminar de la variable, por tanto se utilizó el análisis
gráfico. En el gráfico de residuales contra predichos, se observa una forma de cono conforme
aumentan los predichos aumenta la variabilidad de los residuales; es decir el supuesto de
homocedasticidad se rechaza. Con el gráfico Normal Q-Q, se observa que no hay un patrón definido en
los datos, es decir el supuesto de normalidad se incumple. Ahora, en el gráfico de residuos
estandarizados contra los puntos, se confirma un valor atípico específicamente en el punto 3.
(Ver anexos Figura 4)
Es por ello que se realizaron medidas remediales con los valores extremos;
primeramente se calcula el promedio de los valores de demanda bioquímica de oxigeno en el
punto 3, sin el valor atípico. El valor atípico se sustituyó por el promedio anteriormente
calculado.
Gráfico 8. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos
Fuente: INISA
Luego, para corregir el problema de los supuestos de normalidad y homocesdaticidad,
se decidió utilizar la transformación de Box-Cox, el cual dió como resultado un valor de -0,74.
Aplicando la transformación correspondiente, se evalúan nuevamente los supuestos,
realizando los siguientes gráficos:
Gráfico 9. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos y la transformación
Fuente: INISA
Note que en el gráfico de residuales contra predichos, el supuesto de homocedasticidad
se cumple, pues no se observa ningún patrón definido de los datos. Luego, con el supuesto de
normalidad se incumplen puesto que los datos no se ajustan a un patrón de la línea de
normalidad.
Salida 7. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test
data: model1t$resW = 0.9215, p-value = 0.01395
Para confirmar la homocedasticidad en la demanda bioquímica de oxigeno, se realiza
la prueba de Barttlet, dando como resultado el no rechazo del supuesto. (P-value
0,1852>0,05).
Salida 8. Prueba de homocedasticidad Bartlett
Bartlett test of homogeneity of variances
data: dbo^-0.685149 by punto
Bartlett's K-squared = 3.373, df = 2, p-value = 0.1852
Como el supuesto de normalidad se rechaza, se decide aplicar el método no
paramétrico de Kruskall - Wallis, dando como resultado que el punto de muestreo no es
significativo en la demanda bioquímica de oxigeno. (P-value 0,1316>0,05).
Salida 9. Prueba de Kruskall WallisKruskal-Wallis rank sum test
data: dbo^-0.685149 by punto
Kruskal-Wallis chi-squared = 4.0563, df = 2, p-value = 0.1316
pH
Para la variable pH, se realizó un análisis gráfico preliminar, pero como no violaba los
supuestos de una manera abrupta. No se realizó ninguna transformación y ningún cambio en
los valores extremos ya que no se ameritaba.
A continuación se muestra el análisis de supuestos:
Gráfico 10. Matriz de gráficos de evaluación de supuestos
Fuente: INISA
Se ve que le valor extremo no es un valor atípico ya que se encuentra en el rango
aceptable de -3 a 3, en el gráfico de residuos estandarizados contra los puntos. Además, en el
gráfico de Normal Q-Q los datos no se ajusta adecuadamente a la línea de normalidad, por
tanto el supuesto se rechaza, como el gráfico no se observa muy evidente la no normalidad, se
optó por la realizar la prueba de Shapiro, dando como resultado el rechazo del supuesto.
(p-value 0,04677<0.05). Luego, el gráfico de residuales contra predichos no hay un patrón
definido, confirmando así el supuesto de homocedasticidad.
Salida 10. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test
data: model2$res
W = 0.9388, p-value = 0.04677
Como el supuesto de normalidad se incumple, se realiza el método no paramétrico
Kruskall- Wallis, se confirma que hay diferencias entre los puntos con respecto al pH. (p-value
0,001845 < 0,05).
Salida 11. Prueba de Kruskall WallisKruskal-Wallis rank sum test
data: ph by punto
Kruskal-Wallis chi-squared = 12.59, df = 2, p-value = 0.001845
Con ese resultado se opta por realizar comparaciones múltiples entre los puntos
mediante la prueba Tukey. Con el siguiente gráfico, donde se refleja los puntos pares contra
las diferencias en promedio con los niveles de cada punto.
Gráfico 11. Prueba de Tukey, diferencia de medias en cada par de puntos
Fuente: INISA
Se observa que la comparación del punto 1 y el punto 2, el intervalo de la diferencia de
las medias de cada punto contempla el 0, mientras que las comparaciones entre el punto 3 y
punto 1, y además los pares punto 3 y punto 2, los intervalos se excluye el 0, es decir la
cantidad de pH en el punto 3 es significativa comparada con los demás puntos.
Nitrato
Igualmente se ejecutó un análisis gráfico preliminar de la variable, se no visualizaron
problemas en la normalidad, pues los valores se ajustaban a la línea de normalidad. Con
respecto a la homocedasticidad, esta se incumple, ya que se visualiza un patrón de cono en el
gráfico de residuales contra valores predichos. Además, no se observan valores extremos. (Ver
Anexos)
Como medida remedial, igual se realizó una transformación para mejorar los
problemas de heterocedasticidad con el método box cox el cual indicó un valor de 0,3979.
A continuación el análisis de supuestos después de ejecutar las medida remedial:
Gráfico 12. Matriz de gráficos de evaluación de supuestos con la transformación
Fuente: INISA
Se puede contemplar, que en gráfico de residuales contra predichos presenta una forma
de cono, por tanto se rechaza homocedasticidad. En gráfico Normal Q-Q, se observa que los
datos se encuentran en la línea de normalidad, es decir el supuesto se cumple. Finalmente, en
el gráfico de residuos estandarizados contra los puntos, no se presentan valores extremos.
Salida 12. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test
data: model3t$res
W = 0.9568, p-value = 0.1711
Salida 13. Prueba de homocedasticidad BartlettBartlett test of homogeneity of variances
data: dbo^0.3979999 by punto
Bartlett's K-squared = 12.7539, df = 2, p-value = 0.001700
Como el supuesto de normalidad se cumple, pero se presenta heterocedasticidad, es por
ello que se opta por realizar la prueba Welch, dando como resultado que la cantidad de nitrato
es diferente con respecto a cada punto de muestreo. (p-value 1,08e-06<0,05).
Salida 14. Prueba WelchOne-way analysis of means (not assuming equal variances)
data: nitra and punto
F = 30.6538, num df = 2.000, denom df = 19.128, p-value = 1.082e-06
Para la comparación múltiple entre los puntos, se realiza Tukey, y se confirma con un
95% de confianza que el punto 3 difiere en la cantidad de nitrato con respecto a cada punto.
Gráfico 13. Prueba de Tukey, diferencia de medias en cada par de puntos
Fuente: INISA
Al igual que la variable pH, se observa que la comparación del punto 1 y el punto 2, el
intervalo de la diferencia de las medias de cada punto contempla el 0, mientras que las
comparaciones entre el punto 3 y punto 1, y además los pares punto 3 y punto 2, los intervalos
se excluye el 0, es decir la cantidad de nitrato en el punto 3 es significativa comparada con los
demás puntos.
Análisis en caso de la presencia de heterocedasticidad: Pruebas no paramétricas y otros
medios
Basados en el artículo de Karl Moder, se realizó un análisis de algunos métodos que se
utilizan en el campo experimental cuando se da la presencia de la desigualdad de varianzas.
La heterocedasticidad se ha considerado un serio problema a la hora de realizar un
análisis de variancia, especialmente en diseños desequilibrados. Cuando no se cumple la
homocedasticidad, la prueba t y la F tienen a no rechazar la hipótesis de igualdad de
variancias, es decir superan el valor nominal de alfa; dependiendo de si el diseño es
balanceado o no, el número de observaciones y el número de niveles de cada factor. Se han
recomendado diferentes soluciones como:
i. Mantener la tasa de error tipo I por debajo del nivel del 5% seleccionando un nuevo valor
crítico de F a un nivel de significancia más estricto. Esto no es apropiado ya que se pierde
potencia de la prueba y el nivel de alfa no se mantiene en muchas situaciones.
ii. Utilizar transformaciones como raíz cuadrada, logaritmo, arsen, para normalizar las
distribuciones. Esto no conduce a varianzas homogéneas, sino que las pruebas de
homocedasticidad no lo suficientemente potente como para encontrar significancia.
iii. Utilizar métodos robustos para el análisis. Una opción es la prueba de Welch que mantiene
la tasa de error tipo I, a pesar de la heterocedasticidad.
iv. Utilizar pruebas no paramétricas, como Kruskall-Wallis.
En el artículo se examinaron estos métodos mediante el proceso de simulación para
determinar cual es el más adecuado para cuando se presenta la desigualdad de varianzas.
Basados en esas recomendaciones escogieron siete diferentes tipos de métodos de análisis:
1. Prueba F para análisis de varianzas como método estándar.
2. Prueba de Welch para más de dos muestras. La prueba de Welch es considerada en
muchos paquetes estadísticos como la opción adecuada para cuando haya problema de
heterocedasticidad.
3. ANOVA ponderado disponible en SAS basado en la aproximación Satterthwaite en
análisis con varias repeticiones.
4. Prueba de Kruskal-Wallis.
5. Prueba de permutaciones usando el estadístico F (implementado en paquete de R
“coin”)
6. Prueba de permutaciones basado en Kruskall-Wallis.
7. Tipo especial de la T cuadrada de Hotelling. Esta es usada en diseños balanceados con
muchas observaciones por grupo de cada nivel del factor.
Para este análisis de simulación se utilizaron 100 000 datos con distribución normal y
se desarrollaron los siete métodos en diseños balanceados y en diseños desbalanceados
excluyeron la prueba de T cuadrada de Hotelling. Los niveles de cada factor van entre 3 y 20,
de 3 a 30 observaciones y la desviación entre 1 y 3.
Gráfico 14. Significancia empírica para 5 niveles de un factor y 5 observaciones
cada uno con un rango de σ 1:σ 2:… :σ 5=3 :1: … :1(α=0,05)
Fuente: Alternatives to F-Test in One Way ANOVA in case of heterogeneity of variances (a simulation study)
En el gráfico 1 se observa el error empírico tipo I comparada con un alfa nominal de
0,05. Se tienen 5 niveles de cada factor, 5 observaciones por muestra y las
desviaciones con una relación de 3:1:...:1. Para los métodos de Kruskall-Wallis y T
cuadrada de Hotelling, ambos mantienen el alfa nominal de 0,05. Los otros métodos
exceden este valor en más del 8,6%; teniendo el peor ajuste la prueba F de ANOVA
estándar y la prueba de permutaciones con el estadístico F.
Welch está dentro del 20% de tolerancia, esta puede ser apropiada para esta situación
en específico.
Gráfico 15. Significancia empírica para 5 niveles de un factor y 5 observaciones
cada uno con un rango de σ 1:σ 2:… :σ 5=3 :1: … :1(α=0,10)
Fuente: Alternatives to F-Test in One Way ANOVA in case of heterogeneity of
variances (a simulation study)
En el gráfico 2 se presentan la misma situación del gráfico 1 a diferencia de que se
tomó un alfa nominal de 0,01. En este caso se observan resultados similares al gráfico 1: la
prueba de Kruskall-Wallis tiende a ser conservador y la prueba t cuadrado de Hotelling es el
único método que mantiene el alfa nominal exacto.
La prueba de t cuadrado de Hotelling puede ser usada en situaciones donde el número
de observaciones por muestra es al menos el número de niveles de factor. Esto porque no hay
programa que pueda calcular la densidad acumulada de la función t cuadrada directamente,
por lo tanto se utiliza una aproximación con la función F. Para esta prueba específica esto
restringe el número de niveles de factor al número de observaciones al máximo. Teniendo
disponibles tablas t cuadrado no se tendría esta limitación.
Aún en situaciones con estrecha relación de desviaciones estándar, la prueba F y la
prueba de permutaciones con este estadístico no mantienen el alfa nominal.
Cuando tenemos diseños balanceados, la prueba de Welch no es apropiada en
situaciones cuando el número de factores es mayor, especialmente con tamaños de muestra
pequeña. El análisis por mínimos cuadrados ponderados no es muy apropiada en la mayoría de
situaciones. Además, la prueba de Kruskall-Wallis es muy conservadora si el tamaño de
muestra es más pequeño o igual al número de niveles de factor. Raramente esto también
ocurre en la prueba oneway-test, especialmente en diseños de bloques.
La prueba de permutaciones utilizando el estadístico de Kruskall-Wallis excede el alfa
nominal en forma tolerable. La prueba t cuadrado de Hotelling es mejor aunque parece ser
conservadora en varias situaciones, como en muestras pequeñas. Esto puede darse por utilizar
la aproximación con la función F.
La prueba de Kruskall-Wallis para niveles pequeños de factor el cálculo exacto de
probabilidad lleva a tener un error tipo I mayor al esperado. Usando pruebas de permutación
con pequeños tamaños de muestra y alto número de permutaciones es problemático porque
hay un número bastante pequeño de reorganización de los datos, la probabilidad de crear todos
los datos posibles es varias veces más alta.
En el caso de diseños desbalanceados, Box dice que la “influencia de la
heterocedasticidad es mucho mayor en diseños desbalanceados que balanceados”. En este
estudio se confirmó lo dicho.
Para pequeños número de niveles del factor ningún método mantiene un alfa nominal.
Las pruebas de Welch y ANOVA ponderado se comportan mejor en esta situación pero con
mayor número de niveles de factor, los resultados se ponen peor.
La prueba de Kruskall-Wallis vuleve mejor para mayor número de niveles de factor
pero cuando aumenta el número de observaciones el problema se pone peor.
Para este caso, ningún método es apropiado con la presencia de heterocedasticidad,
dando como afirmación que a un tamaño de más grande de muestra no corresponde a una
mayor varianza.
Cuando hay gran diferencias entre las desviaciones estándar, con gran número de
observaciones y el número de niveles de factor es pequeño, todos los métodos trabajan bien.
Tan pronto como aumenta el nivel de los factores sólo un método es apropiado: la prueba de
permutaciones con el estadístico Kruskall-Wallis; pero esta prueba se vuelve conservadora si
el número de observaciones aumenta.
La estrategia de probar utilizando estos métodos no es usado por la baja potencia que
presentan estas pruebas. Por tanto, ante las sospechas de heterocedasticidad, se puede aplicar
la prueba t cuadrado de Hotelling.
En el caso de diseños desbalanceados, se debe buscar el método que mejor se adapte a
cada situación específica.
Kruskal Wallis: Pruebas De Comparaciones Múltiples No Paramétricas A Posteriori
Cuando realiza la prueba de análisis de varianza no paramétrica como la prueba de
Kruskal Wallis se tiene como objetivo observar si las medianas de los grupos a comparar son
diferentes, si la prueba confirma que son diferentes surge la duda de qué prueba de
comparaciones múltiples utilizamos, este problema es muy común puesto que la mayoría
estudios los residuos no se distribuyen normal , además las medidas remediales existen no
ayudan a la solución de este tipo de problemas, por otro lado cabe resaltar que en el ámbito
académico no se presta mucho énfasis a este tipo de pruebas. Ante esta situación se realizo una
revisión bibliográfica para ver cuales pruebas de comparaciones múltiples son las más
utilizadas en el ámbito estadístico, según diversos autores (Gibbons, 1986 ; Leach, 1979;
García et al, 2007) hay dos pruebas las cuales son: la prueba de comparación múltiple de Dunn
y la prueba de Sumas de Rangos de Wilcoxon.
Prueba de Comparaciones Múltiples De Suma De Rangos De Wilcoxon.1
Es la prueba no paramétrica homologa a la prueba t para análisis paramétricos, esta
prueba es la misma que se ve en los cursos de métodos estadísticos.
La prueba de suma de rangos de Wilcoxon lo que busca es probar que la distribución
de las frecuencias de la medidas originales es la misma para los grupos considerados, o por el
contrario que no existen diferencia entre los grupos (Gutíerrez, 2010). La única diferencia con
1 Como el objetivo de este trabajo no es explicar cómo se realiza la prueba, se remite a lector al libro “Introduction to Statistics: a Nonparametric Approach for the Social Sciences” página 160 del autor John Wiley.
la prueba de Suma de Rangos de Wilcoxon es el alfa o nivel de significancia utilizado, debido
que al hacer comparaciones múltiples este se divide entre el número de comparaciones
múltiples a realizar α
k (k−1)2
causando que la prueba se vuelva muy conservadora (la
probabilidad de cometer error tipo 1 es muy baja).
Como el objetivo de este trabajo no es explicar cómo se realiza la prueba, se remite al
lector al libro “Introduction to Statistics: a Nonparametric Approach for the Social Sciences”
página 160 de John Wiley.
Prueba de Comparaciones Múltiples De Dunn
Esta prueba es similar a la prueba Tukey para ANOVA y se utiliza para comparar los
grupos entre si cuando no se cumplen los supuestos de normalidad y heterocedasticidad. Se
dice que los grupos son diferentes si la diferencia absoluta de rangos (los mismos utilizados
en la prueba anterior) medios son mayores al estadístico de prueba, por lo tanto la región
crítica se define como (Dunn, 1964):
|Ri−R j|>Z αk (k−1)
2
√ n (n+1)12 ( 1
ni
+ 1n j
)Por lo tanto, si se cumple la condición anterior estaríamos rechazando la hipótesis nula
de igualdad de medianas de los grupos comparados. Al igual que la prueba de Suma de
Rangos de Wilcoxon, esta prueba es altamente conservadoras puesto que divide la
probabilidad de cometer error tipo I entre el total de comparaciones a realizar.
Conclusiones y Recomendaciones
Al finalizar el presente proyecto se puede realizar las siguientes conclusiones:
Las variables microbiológicas presentan valores extremos y mucha variabilidad en
cada una de ellas, debido a su naturaleza.
La presencia de coliformes fecales, Escherichia coli y Enterococcus fecales es
diferente dependiendo del punto del cauce de la cuenca hidrográfica Purires.
En el punto más cercano a la desembocadura del cauce, se da la mayor presencia de
estos agentes microbiológicos. Esto puede deberse al alto grado de contaminación al
que es sometido durante el recorrido por la zona residencial e industrial.
En los otros puntos donde se tomaron las muestras también hay diferencia en la
presencia de estos agentes.
En el caso de los agentes químicos, la demanda bioquímica de oxígeno no depende del
punto donde se tome la muestra en el río Purires. Es decir, la presencia de este no se
debe al lugar del cauce.
La presencia de pH y nitrato es significativa al punto donde se tome la muestra de agua
del cauce Purires. Específicamente, el punto al finalizar la zona industrial presenta
mayor presencia de estas sustancias. Al igual que los agentes microbiológicos esto
puede deberse a un grado de contaminación mayor en la zona.
Se recomienda que para un futuro análisis de estos datos, se realice un trabajo mayor con
la presencia de profesionales en el área de diseños experimentales.
En el caso del análisis para cuando hay presencia de heterocedasticidad se puede concluir:
La prueba F estándar utilizada en el análisis ANOVA es inadecuada cuando se
presenta heterocedasticidad.
La prueba t cuadrado de Hotelling mantiene el alfa nominal exacto en todas las
situaciones de diseños balanceados. En algunos casos puede ser conservadora, esto
puede deberse a su aproximación mediante la función F.
La prueba Kruskall-Wallis no excede el alfa nominal en algunas situaciones pero es
muy conservadora.
Las pruebas de permutaciones no son una solución para la heterocedasticidad,
especialmente la que utiliza el estadístico F.
La prueba de Welch puede ser útil para pequeños niveles de factor pero inadecuada
para más de 2 o 3 niveles.
La prueba de SAS, ANOVA ponderado, no es recomendable.
Para la presencia de heterocedasticidad, sólo el método t cuadrado de Hotelling es el
más adecuado.
Bibliografía
Arias, M., Antillón, F., Chaves, C., Villalobos, L. (2008). Microbiología de aguas y alimentos:
principios y prácticas de laboratorio. San José: Editorial UCR. pp 19.
Blancas, C., Hervás, M. (2001) Manuales de Salud Ambiental. Contaminación de las aguas
por nitratos y efectos sobre la salud. Consejería de Salud.Título IV. Serie WA 754. pp
25
Dunn, O. J. (Agosto de 1964). Multiple Comparisons Using Rank Sums. Technometrics,
Vol.6(No.3), 241-252.
Forbes, B., Sahm, D., Weissfeld, A. (2009). Diagnóstico microbiológico. Buenos Aires:
Médica Panamericana. 12 ed. pp. 268.
García, S., Molina, D., Lozano, M., & Herrera, F. (2007). Un estudio experimental sobre el
uso de test no paramétricos para analizar el comportamiento de los algoritmos
evolutivos en problemas de optimizacion. Universidad de Granada.
Gibbons, J. D. (Agosto de 1986). Nonparametric Methods for Quantitative Analysis.
Technometrics, Vol. 28(No.3), 275-277.
Goyenola, G (2007), Guía para la utilización de las Valijas Viajeras, Determinación del pH.
Red de Monitoreo Ambiental Participativo de Sistemas Acuáticos, RED MAPSA.
Gutíerrez Espeleta , E. (2010). Analisis con dos variables o dos grupos de datos: Prueba de
rangos de Wilcoxon. En Métodos Estadísticos para las Ciencias Biológicas (págs. 68-
69). Heredia: Editorial Universidad Nacional.
Leach, C. (1979). Test for Several Independent Samples- Categorical Explanatory Variable:
Multiple Comparisons Using the Rank Sum Test. En Introduction to Statistics: a
Nonparametric Approach for the Social Sciences (págs. 160-166). New York: John
Wiley & Sons.
León, C. (2009). Estandarización y validación de una técnica para medición de la demanda
bioquímica de oxígeno por el método respirométrico y la demanda química de oxígeno
por el método colorimétrico. Pereira: Universidad Tecnológica de Pereira. pp 2.
Meng, J., Feng, P., Doyle, M. (2001). Pathogenic Escherinchia coli. F. Pouch y K. Ito (Eds.).
Compendium of methods for the microbiological examination of food. Washington:
APHA. pp.331-336.
Moder, K. (2010). Alternatives to F-Test in One Way ANOVA in case of heterogeneity of
variances (a simulation study). Psychological Test and Assessment Modeling. Volumen
52 (4), pp. 343-353.
Pascual, M. y Calderón, V. (2000). Microbiología alimentaria: metodología analítica para
alimentos y bebidas. Madrid: Editorial Días y Santos. pp. 17.
Figura 1. Coliformes Fecales, Matriz de gráficos de evaluación de supuestos
Anexos
Fuente: INISA
Figura 2. E Coli, Matriz de gráficos de evaluación de supuestos
Figura3. Enteroccocus fecalis, Matriz de gráficos de evaluación de supuestos
sssss supuestos
Fuente: INISA
Fuente: INISA
Figura 4. Demanda Bioquímica de Oxigeno, Matriz de gráficos de evaluación de supuestos
Fuente: INISA
Figura 5. Nitrato, Matriz de gráficos de evaluación de supuestos
Fuente: INISA