viernes, 3 de octubre de 2014

ANÁLISIS DE VARIANZA Y PRUEBAS DE MEDIAS DEL DISEÑO BLOQUES AZAR EN R

ANÁLISIS DE VARIANZA Y PRUEBAS DE MEDIAS DEL DISEÑO BLOQUES AZAR EN R

Ing. Luis Manfredo Reyes
El diseño en bloques al azar, es el más utilizado en todas partes, debido a que casi siempre en las condiciones experimentales existe una gradiente que debe ser controlada, o simplemente para reducir el error experimental

El diseño se debe manejar con iguales repeticiones (balanceado). El caso de desiguales repeticiones (desbalanceado), implica estimación de datos faltantes (más información en http://reyesestadistica.blogspot.com/2011/07/estimacion-de-datos-perdidos-en-el.html. ) Afortunadamente en ambos casos, es posible realizar el análisis en R

R es un paquete estadístico producido  en el proyecto GNU , y se puede descargar en éste link:

http://www.r-project.org/


Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.

A continuación un ejemplo
1.      Un experimento consistió en la evaluación de 5 nuevas variedades de maíz, con un diseño de bloques al azar. Calcule el andeva y aplique prueba de Tukey si es necesario. Use un alfa de 1% (datos en quintales por manzana)


I
II
III
IV
1
15
18
15
16
2
22
23
24
20
3
25
30
35
35
4
20
21
22
23
5
40
40
40
40


Paso 1: Creación del archivo de datos
En R  se definen tres variables
Identificación del tratamiento (numérica)
Identificación del bloque (NUMÉRICA)
Rendimiento (numérica)
En total hay 20 observaciones:
La forma más fácil de ingresar los datos en R, es invocando el editor de datos con la siguiente instrucción

Datos <- edit(as.data.frame(NULL))
Se da click sobre la primera fila para ingresar los nombres de las variables y el tipo

EXISTEN OTRAS OPCIONES EN R PARA EL INGRESO DE DATOS, INCLUYENDO R COMMANDER, SIN EMBARGO HAY QUEJAS DE QUE EL ACCESORIO "SE TRABA".

En R, es necesario definir las variables independientes como factores con las siguientes órdenes:
Datos$BLOQUE<- as.factor(Datos$BLOQUE)
DatosTRATAMIENTO <- as.factor(Datos$TRATAMIENTO)

ahora se especifica el análisis de varianza:
Andeva <-aov(RENDIMIENTO~BLOQUE+TRATAMIENTO,data=Datos)

se muestran los resultados
summary(Andeva)

y luego se especifica la prueba de Tukey:
TukeyHSD(Andeva,"TRATAMIENTO",ordered=TRUE,conf.level=0.95)

los resultados son:

> Andeva <-aov(RENDIMIENTO~BLOQUE+TRATAMIENTO,data=Datos)

> summary(Andeva)
                      Df Sum Sq  Mean Sq   F value   Pr(>F)    
BLOQUE           3     23.2       7.7       1.421    0.285    
TRATAMIENTO  4  1430.7   357.7     65.729   4.66e-08 ***
Residuals        12     65.3       5.4                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

> TukeyHSD(Andeva,"TRATAMIENTO",ordered=TRUE,conf.level=0.95)
  Tukey multiple comparisons of means
    95% family-wise confidence level
    factor levels have been ordered

Fit: aov(formula = RENDIMIENTO ~ BLOQUE + TRATAMIENTO, data = Datos)

$TRATAMIENTO
     diff        lwr       upr     p adj
4-1  5.50  0.2423468 10.757653 0.0389223
2-1  6.25  0.9923468 11.507653 0.0178321
3-1 15.25  9.9923468 20.507653 0.0000068
5-1 24.00 18.7423468 29.257653 0.0000000
2-4  0.75 -4.5076532  6.007653 0.9900421
3-4  9.75  4.4923468 15.007653 0.0005558
5-4 18.50 13.2423468 23.757653 0.0000009
3-2  9.00  3.7423468 14.257653 0.0011222
5-2 17.75 12.4923468 23.007653 0.0000013
5-3  8.75  3.4923468 14.007653 0.0014263


Se encontraron diferencias significativas al 1% entre los tratamientos.
Según la prueba de Tukey, el mejor tratamiento (el de más alto rendimiento) es el 5.


No hay comentarios:

Publicar un comentario