viernes, 3 de octubre de 2014

ANÁLISIS DE VARIANZA Y PRUEBAS DE MEDIAS DEL DISEÑO AL COMPLETO AZAR EN R

ANÁLISIS DE VARIANZA Y PRUEBAS DE MEDIAS DEL DISEÑO AL COMPLETO AZAR EN R

Ing. Luis Manfredo Reyes
El diseño al completo azar, también conocido como Al Irrestricto azar, de una vía o Oneway, es el más sencillo de todos los diseños experimentales disponibles, pero tiene el inconveniente que para su utilización se requieren condiciones homogéneas en el sitio experimental (por ejemplo: laboratorio).



El diseño se puede manejar con iguales repeticiones (balanceado) o desiguales (desbalanceado).
Es posible realizar el análisis en R


R es un paquete estadístico producido  en el proyecto GNU , y se puede descargar en éste link:

http://www.r-project.org/

Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.

A continuación ejemplos de los mismos
CASO 1: DISEÑO AL COMPLETO AZAR BALANCEADO


1.    Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial, comparándola con la de una dieta sin sal.
Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada  y al quinto el mismo fármaco a otra dosis. 
resultados finales:

Los datos se ingresan a R  así:
Por la cantidad de datos que se tienen, se recomienda usar el editor de datos de R
se ingresa la siguiente orden:
Datos <- edit(as.data.frame(NULL))

En la primera columna se coloca el identificador de tratamientos, que puede ser numérico o alfanumérico y se llama TRATAMIENTO

En la segunda columna se colocan los datos de la variable respuesta,que se llama PRESION
En total hay 25 observaciones

R tiene varias formas de ingresar los datos, incluyendo la importación de datos desde Excel, o por medio de R Commander, pero hay muchas quejas que R Commander a menudo "se traba" 

Ahora se especifica el análisis de varianza
Andeva <- aov(PRESION~TRATAMIENTO,data=Datos)

Se presentan los resultados
summary(Andeva)

y finalmente se solicita la prueba de Tukey
TukeyHSD(Andeva, "TRATAMIENTOS", ordered=TRUE, conf.level=0.95)

Y los resultados finales son:
                      Df Sum Sq Mean Sq F value   Pr(>F)    
TRATAMIENTO  4 2010.6   502.7   11.24      6.06e-05 ***
Residuals        20   894.4    44.7                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Tukey Contrasts


Fit: aov(formula = PRESION ~ TRATAMIENTO, data = Datos)

Linear Hypotheses:
                      Estimate Std. Error t value Pr(>|t|)    
DOSIS2 - DOSIS1 == 0    -6.600      4.229  -1.560   0.5378    
POBRE - DOSIS1 == 0      8.400      4.229   1.986   0.3080    
SINSAL - DOSIS1 == 0     6.600      4.229   1.560   0.5378    
TESTIGO - DOSIS1 == 0   20.200      4.229   4.776   <0.001 ***
POBRE - DOSIS2 == 0     15.000      4.229   3.547   0.0155 *  
SINSAL - DOSIS2 == 0    13.200      4.229   3.121   0.0384 *  
TESTIGO - DOSIS2 == 0   26.800      4.229   6.337   <0.001 ***
SINSAL - POBRE == 0     -1.800      4.229  -0.426   0.9926    
TESTIGO - POBRE == 0    11.800      4.229   2.790   0.0751 .  
TESTIGO - SINSAL == 0   13.600      4.229   3.216   0.0315 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
(Adjusted p values reported -- single-step method)

Interpretación: suponiendo que se desea el análisis con el 3% de significancia,
como el p es menor que 0.03, se concluye que sí existen diferencias significativas entre los tratamientos
La prueba de Tukey en este caso muestra las comparaciones todos contra todos


No hay comentarios:

Publicar un comentario