lunes, 6 de octubre de 2014

ANÁLISIS DE VARIANZA Y PRUEBAS DE MEDIAS DEL DISEÑO BLOQUES AZAR EN R PARA ANDROID

ANÁLISIS DE VARIANZA Y PRUEBAS DE MEDIAS DEL DISEÑO BLOQUES AZAR EN R PARA ANDROID

Ing. Luis Manfredo Reyes
El diseño en bloques al azar, es el más utilizado en todas partes, debido a que casi siempre en las condiciones experimentales existe una gradiente que debe ser controlada, o simplemente para reducir el error experimental



El diseño se debe manejar con iguales repeticiones (balanceado). El caso de desiguales repeticiones (desbalanceado), implica estimación de datos faltantes (más información en http://reyesestadistica.blogspot.com/2011/07/estimacion-de-datos-perdidos-en-el.html. ) Afortunadamente en ambos casos, es posible realizar el análisis en R

R es un paquete estadístico producido  en el proyecto GNU, muy popular en el mundo académico. Por ser un programa gratuito, era cuestión de tiempo que apareciera una versión para el sistema operativo Android. 

La versión para Android se llama R-Console y puede descargarse del Play Market de Android. 

Existe una versión gratuita y otra pagada, siendo la diferencia la presentación de publicidad en la versión gratuita.

Lamentablemente, por ser Android un sistema operativo orientado a tabletas y teléfonos, no cuenta con todas las características de las versiones para escritorio. Una de las deficiencias es la ausencia del editor de datos. Afortunadamente es posible realizar el análisis del diseño al completo azar en R-Console, mediante procedimientos alternos de ingreso


Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.

A continuación un ejemplo
        PROBADO EN UNA TABLETA HEWLETT PACKARD Y UN TELEFONO SAMSUNG GALAXY NOTE II
        Un experimento consistió en la evaluación de 5 nuevas variedades de maíz, con un diseño de bloques al azar. Calcule el andeva y aplique prueba de Tukey si es necesario. Use un alfa de 1% (datos en quintales por manzana)


I
II
III
IV
1
15
18
15
16
2
22
23
24
20
3
25
30
35
35
4
20
21
22
23
5
40
40
40
40


Paso 1: Creación del vector de variable respuesta 
Se deben ingresar los datos de cada tratamiento juntos (por columna)
RENDIMIENTO<-c(15,18,15,16,22,23,24,20,25,30,35,35,20,21,22,23,40,40,40,40)

Paso 2: ingresar los datos de los bloques (por fila)

BLOQUE<-c(1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4)

Paso 3: ingresar los datos de los tratamientos
TRATAMIENTO<-c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5)

Paso 4: Armar la matriz de datos y de una vez convertir los tratamientos y los bloques a factores

datos<-data.frame(TRATAMIENTO=factor(TRATAMIENTO),BLOQUE=factor(BLOQUE),RENDIMIENTO)


En total hay 20 observaciones:

Paso 5: ahora se especifica el análisis de varianza:
Andeva <-aov(RENDIMIENTO~BLOQUE+TRATAMIENTO,data=datos)

se muestran los resultados
summary(Andeva)

y luego se especifica la prueba de Tukey:(el nivel de confianza puede ser cualquiera)
TukeyHSD(Andeva,"TRATAMIENTO",ordered=TRUE,conf.level=0.95)

los resultados son:

> Andeva <-aov(RENDIMIENTO~BLOQUE+TRATAMIENTO,data=Datos)

> summary(Andeva)
                      Df Sum Sq  Mean Sq   F value   Pr(>F)    
BLOQUE           3     23.2       7.7       1.421    0.285    
TRATAMIENTO  4  1430.7   357.7     65.729   4.66e-08 ***
Residuals        12     65.3       5.4                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

> TukeyHSD(Andeva,"TRATAMIENTO",ordered=TRUE,conf.level=0.95)
  Tukey multiple comparisons of means
    95% family-wise confidence level
    factor levels have been ordered

Fit: aov(formula = RENDIMIENTO ~ BLOQUE + TRATAMIENTO, data = Datos)

$TRATAMIENTO
     diff        lwr       upr     p adj
4-1  5.50  0.2423468 10.757653 0.0389223
2-1  6.25  0.9923468 11.507653 0.0178321
3-1 15.25  9.9923468 20.507653 0.0000068
5-1 24.00 18.7423468 29.257653 0.0000000
2-4  0.75 -4.5076532  6.007653 0.9900421
3-4  9.75  4.4923468 15.007653 0.0005558
5-4 18.50 13.2423468 23.757653 0.0000009
3-2  9.00  3.7423468 14.257653 0.0011222
5-2 17.75 12.4923468 23.007653 0.0000013
5-3  8.75  3.4923468 14.007653 0.0014263


Se encontraron diferencias significativas al 1% entre los tratamientos.
Según la prueba de Tukey, el mejor tratamiento (el de más alto rendimiento) es el 5.

ESTE PROCEDIMIENTO TAMBIÉN FUNCIONA EN LAS VERSIONES DE ESCRITORIO DE R (WINDOWS Y LINUX)

No hay comentarios:

Publicar un comentario