viernes, 17 de julio de 2015

ANÁLISIS DE EXPERIMENTOS EN PARCELAS DIVIDIDAS CON SAS®



ANÁLISIS DE EXPERIMENTOS EN PARCELAS DIVIDIDAS CON SAS®
Ing. Luis Manfredo Reyes

Aunque en la literatura muchos autores lo consideran un diseño aparte, en realidad Parcelas Divididas es un arreglo especial  de tratamientos de un experimento factorial.

En un factorial tradicional se combinan los niveles “todos contra todos”, mientras que en parcelas divididas,  se define una “parcela grande” que contiene los niveles del factor A, y dentro de ella se definen las “parcelas chicas” que contienen los niveles del factor B.

La principal justificación del uso de éste arreglo es por facilitar el manejo del experimento, pues comparada con el diseño tradicional se pierde precisión en la parcela grande, además de que existen dos errores que deben ser considerados.

El objetivo de éste artículo no es profundizar en los detalles del análisis manual del diseño, sino definir cómo se realiza en el paquete estadístico SAS


El software SAS (Statistical Analisys System) ha sido considerado como el más potente para análisis estadístico, pero siempre tuvo el gran inconveniente de su elevado costo (se paga una licencia anual).

Afortunadamente, en una decisión sorpresiva pero agradable, el CEO de SAS decidió liberar el software para uso de estudiantes, profesores e investigadores (más información de cómo obtener el software aquí: http://reyesestadistica.blogspot.com/2015/06/milagro-sas-libera-version-gratuita.html
Se asume que el lector ya instaló el software y conoce su uso básico.




Ejemplo:
Factores: 2
Factor A: niveles 2
Factor B: niveles 3
Diseño: bloques al azar, con tres repeticiones
En la primera columna está el número de bloque
En la segunda la identificación de parcela (no se usa en SAS, puede ser eliminada pero se incluye aquí como forma de ordenar los datos)
En la tercera el nivel del factor A
En la cuarta el nivel del factor B
En la quinta, la variable respuesta  (rendimiento)

El archivo se puede generar  en Excel y luego convertirlo a CSV. O se puede ingresar directamente en el editor de SAS. En éste ejemplo se hará un ingreso directo, por ser pocos datos








Procedimiento para el análisis  
En la ventana EDITOR se ingresa lo siguiente: (el símbolo $ después de un nombre de variable indica que la variable es de naturaleza alfanumérica)

Data andeva;
Input bloque parcela $ A $ B $ rdto;
Cards;
1 p1 a1 b1 4
1 p2 a1 b2 1
1 p1 a1 b3 9
1 p2 a2 b1 6
1 p2 a2 b2 10
1 p2 a2 b3 2
2 p3 a1 b1 5
2 p3 a1 b2 3
2 p3 a1 b3 10
2 p4 a2 b1 4
2 p4 a2 b2 14
2 p4 a2 b3 1
3 p5 a1 b1 2
3 p5 a1 b2 2
3 p5 a1 b3 15
3 p6 a2 b1 3
3 p6 a2 b2 12
3 p6 a2 b3 1
Run;
El análisis de varianza se especifica así:

Title “Análisis de varianza de Parcelas Divididas”;
Proc glm;
Class bloque A B;
Model rdto=bloque A bloque*a B A*B;
Test h=A e=bloque*A;
Means A /Tukey lines;
Lsmeans B / pdiff=alladjust=Tukey;
Lsmeans A*B /  pdiff=all adjust=Tukey;
Run;

Todas las instrucciones se ingresan en la ventana EDITOR

el error A está representado por la interacción bloque*A
para probar la hipótesis del factor A, se debe usar como error la interacción bloque*A
para las pruebas del factor B y la interacción A*B es recomendable ajustar las medias antes con la orden lsmeans.
  
Al dar click sobre el ícono de la persona corriendo, o ir a RUN y escoger SUBMIT,  se obtiene lo siguiente:

                         Análisis de varianza de Parcelas Divididas                          1
                                                                  10:39 Thursday, July 17, 2015

                                       The GLM Procedure

                                    Class Level Information

                               Class         Levels    Values

                               bloque             3    1 2 3

                               A                  2    a1 a2

                               B                  3    b1 b2 b3


                            Number of Observations Read          18
                            Number of Observations Used          18
                          Análisis de varianza de Parcelas Divididas                          5
                                                                  10:39 Thursday, July 17, 2015

                                       The GLM Procedure

Dependent Variable: rdto

                                              Sum of
      Source                      DF         Squares     Mean Square    F Value    Pr > F

      Model                        9     336.6666667      37.4074074       8.69    0.0029

      Error                        8      34.4444444       4.3055556

      Corrected Total             17     371.1111111


                      R-Square     Coeff Var      Root MSE     rdto Mean

                      0.907186      35.91317      2.074983      5.777778


      Source                      DF       Type I SS     Mean Square    F Value    Pr > F

      bloque                       2       2.1111111       1.0555556       0.25    0.7882
      A                              1       0.2222222       0.2222222       0.05    0.8260
      bloque*A                  2       4.1111111       2.0555556       0.48    0.6370
      B                               2      29.7777778      14.8888889       3.46    0.0827
      A*B                          2     300.4444444     150.2222222      34.89    0.0001


      Source                      DF     Type III SS     Mean Square    F Value    Pr > F

      bloque                       2       2.1111111       1.0555556       0.25    0.7882
      A                              1       0.2222222       0.2222222       0.05    0.8260
      bloque*A                  2       4.1111111       2.0555556       0.48    0.6370
      B                               2      29.7777778      14.8888889       3.46    0.0827
      A*B                          2     300.4444444     150.2222222      34.89    0.0001


            Tests of Hypotheses Using the Type III MS for bloque*A as an Error Term

      Source                      DF     Type III SS     Mean Square    F Value    Pr > F
      A                            1      0.22222222      0.22222222       0.11    0.7735
                         Análisis de varianza de Parcelas Divididas                          6
                                                                  10:39 Thursday, July 17, 2015

                                       The GLM Procedure

                         Tukey's Studentized Range (HSD) Test for rdto

 NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher
                                Type II error rate than REGWQ.


                         Alpha                                   0.05
                         Error Degrees of Freedom                   8
                         Error Mean Square                   4.305556
                         Critical Value of Studentized Range  3.26115
                         Minimum Significant Difference        2.2556


                  Means with the same letter are not significantly different.


                    Tukey Grouping          Mean      N    A

                                 A        5.8889      9    a2
                                 A
                                 A        5.6667      9    a1

                          Análisis de varianza de Parcelas Divididas                         13
                                                                  10:39 Thursday, July 17, 2015

                                       The GLM Procedure
                                      Least Squares Means
                          Adjustment for Multiple Comparisons: Tukey

                                                        LSMEAN
                                B      rdto LSMEAN      Number

                                b1      4.00000000           1
                                b2      7.00000000           2
                                b3      6.33333333           3


                               Least Squares Means for effect B
                             Pr > |t| for H0: LSMean(i)=LSMean(j)

                                   Dependent Variable: rdto

                        i/j              1             2             3

                           1                      0.0841        0.1875
                           2        0.0841                      0.8461
                           3        0.1875        0.8461

                         Análisis de varianza de Parcelas Divididas                         14
                                                                  10:39 Thursday, July 17, 2015

                                       The GLM Procedure
                                      Least Squares Means
                          Adjustment for Multiple Comparisons: Tukey

                                                           LSMEAN
                             A     B      rdto LSMEAN      Number

                             a1    b1       3.6666667           1
                             a1    b2       2.0000000           2
                             a1    b3      11.3333333           3
                             a2    b1       4.3333333           4
                             a2    b2      12.0000000           5
                             a2    b3       1.3333333           6


                              Least Squares Means for effect A*B
                             Pr > |t| for H0: LSMean(i)=LSMean(j)

                                   Dependent Variable: rdto

   i/j              1             2             3             4             5             6

      1                          0.9110        0.0163        0.9983        0.0100        0.7391
      2        0.9110                          0.0050        0.7391        0.0032        0.9983
      3        0.0163        0.0050                          0.0268        0.9983        0.0032
      4        0.9983        0.7391        0.0268                          0.0163        0.5290
      5        0.0100        0.0032        0.9983        0.0163                          0.0021
      6        0.7391        0.9983        0.0032        0.5290        0.0021

INTERPRETACION:
1. No existen diferencias significativas entre los niveles del factor A
2. No existen diferencias significativas entre los niveles del factor B
3. Sí existe interacción  entre A y B
4. De acuerdo a la prueba de Tukey para la interacción, los tratamientos con mayor rendimiento son a1b3 y a2b2

2 comentarios:

  1. Muy buena presentación. ¿Cuáles son las instrucciones del Parcelas Divididas en un Diseño Completamentamente al Azar?

    ResponderEliminar
  2. Hola, pues en ese caso, como no hay interaccion bloque-tratamiento, se maneja como un simple factorial donde la parcela grande es el factor A, el tratamiento es la parcela pequeña (factor B)
    las instrucciones son asi:
    Class A B;
    Model rdto= A B A*B;
    Means A B A*B/Tukey lines;

    Run;

    ResponderEliminar