domingo, 25 de mayo de 2014

ANÁLISIS DE SERIE DE EXPERIMENTOS EN EL ESPACIO CON R

ANÁLISIS DE SERIE DE EXPERIMENTOS EN EL ESPACIO CON R
Ing. Luis Manfredo Reyes

Cuando un experimento completo se repite en diferentes lugares, se tiene una serie de experimentos en el espacio. Adicionalmente un experimento se puede repetir en el mismo lugar, pero diferentes momentos (Serie de experimentos en el tiempo), o bien en diferentes lugares y diferentes momentos (Serie de experimentos en el espacio y el tiempo).

En el caso de la serie en el espacio, si se utiliza el diseño en bloques al azar,  ocurre el siguiente fenómeno: el bloque 1 de la localidad 1 no es el mismo bloque 1 de la localidad 2, etc. A ésto se le llama ANIDACIÖN y se dice que "el bloque está anidado en la localidad".

Si se utiliza el diseño al completo azar, no existe la anidación y se analiza como cualquier experimento factorial ordinario, usando la localidad como otro factor, y la interacción localidad por tratamiento como otro más.



Las fuentes de variación para éste tipo de experimentos (en bloques al azar)  son:
Localidad
Bloque (dentro de localidad)
Tratamientos
Localidad*Tratamientos
Error
Total

El objetivo de éste documento no es mostrar la metodología de cálculo manual para el proceso, pero existen muchas buenas fuentes de consulta. Se pretende mostar cómo se realiza el análisis con el paquete R

Para ello se parte del siguiente ejemplo:
Evaluación de 9 materiales nuevos de Jícama, en dos localidades del departamento de El Petén, Guatemala, usando bloques al azar con 3 repeticiones (DATOS REALES!!!!)
El archivo en excel es el siguiente:
LOCALIDADCULTIVARBLOQUE       RENDI
SAN ANDRESEC5641145.00
SAN ANDRESEC5642150.00
SAN ANDRESEC5643148.00
SAN ANDRESEC255PA1144.00
SAN ANDRESEC255PA2152.00
SAN ANDRESEC255PA3153.00
SAN ANDRESEC12061146.00
SAN ANDRESEC12062146.00
SAN ANDRESEC12063146.00
SAN ANDRESEC254PR1144.00
SAN ANDRESEC254PR2136.00
SAN ANDRESEC254PR3136.00
SAN ANDRESEC256J1153.00
SAN ANDRESEC256J2153.00
SAN ANDRESEC256J3144.00
SAN ANDRESEC20461132.00
SAN ANDRESEC20462132.00
SAN ANDRESEC20463132.00
SAN ANDRESEC5721146.00
SAN ANDRESEC5722144.00
SAN ANDRESEC5723146.00
SAN ANDRESEC5941153.00
SAN ANDRESEC5942144.00
SAN ANDRESEC5943150.00
SAN ANDRESEC2011155.00
SAN ANDRESEC2012155.00
SAN ANDRESEC2013155.00
SAN JOSEEC5641155.00
SAN JOSEEC5642155.00
SAN JOSEEC5643155.00
SAN JOSEEC255PA1153.00
SAN JOSEEC255PA2152.00
SAN JOSEEC255PA3152.00
SAN JOSEEC12061152.00
SAN JOSEEC12062148.00
SAN JOSEEC12063144.00
SAN JOSEEC254PR1136.00
SAN JOSEEC254PR2136.00
SAN JOSEEC254PR3136.00
SAN JOSEEC256J1160.00
SAN JOSEEC256J2160.00
SAN JOSEEC256J3160.00
SAN JOSEEC20461132.00
SAN JOSEEC20462132.00
SAN JOSEEC20463132.00
SAN JOSEEC5721148.00
SAN JOSEEC5722148.00
SAN JOSEEC5723148.00
SAN JOSEEC5941149.00
SAN JOSEEC5942149.00
SAN JOSEEC5943149.00
SAN JOSEEC2011152.00
SAN JOSEEC2012152.00
SAN JOSEEC2013152.00

Se considera más cómodo almacenar los datos en un archivo  CSV en Excel
El primer paso es importar el archivo desde Excel a R, con la primera fila como nombre de las variables
Datos <- read.table("C:/Users/Luis Reyes/Documents/serie en el espacio.csv", header=TRUE,
+   sep=",", na.strings="NA", dec=".", strip.white=TRUE)

La variable BLOQUE que es numérica se convierte en factor
Datos$BLOQUE <- as.factor(Datos$BLOQUE)

Posteriormente, se definen las fuentes de variación. Para indicar que el bloque está anidado dentro de la localidad se usa la orden LOCALIDAD:BLOQUE
AnovaModel.1 <- (aov(RENDI ~ LOCALIDAD+ LOCALIDAD:BLOQUE+CULTIVAR+LOCALIDAD*CULTIVAR, data=Datos))
> summary(AnovaModel.1)

Adicionalmente, se pueden solicitar pruebas de medias (Tukey, Duncan, etc)
El resultado del andeva es el siguiente:
                             Df Sum Sq Mean Sq F value   Pr(>F)  
LOCALIDAD                     1   60.2    60.2   8.483  0.00648 **
CULTIVAR                         8 2781.5   347.7  49.021 8.55e-16 ***
LOCALIDAD:BLOQUE     4    8.4     2.1   0.295  0.87901  
LOCALIDAD:CULTIVAR  8  222.0    27.7   3.913  0.00256 **
Residuals                            32  227.0     7.1                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


Para éste ejemplo, las conclusiones son:
-Existen diferencias significativas entre localidades
-Existen diferencias significativas entre Cultivares (tratamientos)
-Existe interacción engtre localidad y cultivar
-El coeficiente de variación obtenido indica un buen control del error experimental

Debido a que existe interacción entre localidad y cultivar, se recomienda una prueba de medias para ella (por ejemplo Tukey)















































































































No hay comentarios:

Publicar un comentario