ANÁLISIS DE EXPERIMENTOS EN PARCELAS DIVIDIDAS CON
SAS®
Ing. Luis
Manfredo Reyes
Aunque en
la literatura muchos autores lo consideran un diseño aparte, en realidad
Parcelas Divididas es un arreglo especial de tratamientos de un
experimento factorial.
En un
factorial tradicional se combinan los niveles “todos contra todos”, mientras
que en parcelas divididas, se define una “parcela grande” que contiene
los niveles del factor A, y dentro de ella se definen las “parcelas chicas” que
contienen los niveles del factor B.
La
principal justificación del uso de éste arreglo es por facilitar el manejo del experimento,
pues comparada con el diseño tradicional se pierde precisión en la parcela
grande, además de que existen dos errores que deben ser considerados.
El
objetivo de éste artículo no es profundizar en los detalles del análisis manual
del diseño, sino definir cómo se realiza en el paquete estadístico SAS
El
software SAS (Statistical Analisys System) ha sido considerado como el más
potente para análisis estadístico, pero siempre tuvo el gran inconveniente de
su elevado costo (se paga una licencia anual).
Afortunadamente, en una decisión sorpresiva pero agradable, el CEO de SAS decidió liberar el software para uso de estudiantes, profesores e investigadores (más información de cómo obtener el software aquí: http://reyesestadistica.blogspot.com/2015/06/milagro-sas-libera-version-gratuita.html
Se asume que el lector ya instaló el software y conoce su uso básico.
Afortunadamente, en una decisión sorpresiva pero agradable, el CEO de SAS decidió liberar el software para uso de estudiantes, profesores e investigadores (más información de cómo obtener el software aquí: http://reyesestadistica.blogspot.com/2015/06/milagro-sas-libera-version-gratuita.html
Se asume que el lector ya instaló el software y conoce su uso básico.
Ejemplo:
Factores:
2
Factor A:
niveles 2
Factor B:
niveles 3
Diseño:
bloques al azar, con tres repeticiones
En la primera
columna está el número de bloque
En la
segunda la identificación de parcela (no se usa en SAS, puede ser eliminada pero se incluye aquí como forma de ordenar los datos)
En la
tercera el nivel del factor A
En la
cuarta el nivel del factor B
En la
quinta, la variable respuesta (rendimiento)
El
archivo se puede generar en Excel y
luego convertirlo a CSV. O se puede ingresar directamente en el editor de SAS.
En éste ejemplo se hará un ingreso directo, por ser pocos datos
Procedimiento
para el análisis
En la ventana EDITOR se ingresa
lo siguiente: (el símbolo $ después de un nombre de variable indica que la
variable es de naturaleza alfanumérica)
Data andeva;
Input bloque parcela $ A $ B $
rdto;
Cards;
1 p1 a1 b1 4
1 p2 a1 b2 1
1 p1 a1 b3 9
1 p2 a2 b1 6
1 p2 a2 b2 10
1 p2 a2 b3 2
2 p3 a1 b1 5
2 p3 a1 b2 3
2 p3 a1 b3 10
2 p4 a2 b1 4
2 p4 a2 b2 14
2 p4 a2 b3 1
3 p5 a1 b1 2
3 p5 a1 b2 2
3 p5 a1 b3 15
3 p6 a2 b1 3
3 p6 a2 b2 12
3 p6 a2 b3 1
Run;
El análisis de varianza se
especifica así:
Title “Análisis de varianza de
Parcelas Divididas”;
Proc glm;
Class bloque A B;
Model rdto=bloque A bloque*a B
A*B;
Test h=A e=bloque*A;
Means A /Tukey lines;
Lsmeans B / pdiff=alladjust=Tukey;
Lsmeans A*B / pdiff=all adjust=Tukey;
Run;
Todas las instrucciones se ingresan en la ventana EDITOR
el error A está representado por la interacción bloque*A
para probar la hipótesis del factor A, se debe usar como error la interacción bloque*A
para las pruebas del factor B y la interacción A*B es recomendable ajustar las medias antes con la orden lsmeans.
Al dar click sobre el ícono de la persona corriendo, o ir a RUN y escoger SUBMIT, se obtiene lo siguiente:
Análisis de varianza de Parcelas Divididas 1
10:39 Thursday, July 17, 2015
The GLM Procedure
Class Level Information
Class Levels Values
bloque 3 1 2 3
A 2 a1 a2
B 3 b1 b2 b3
Number of Observations Read 18
Number of Observations Used 18
10:39 Thursday, July 17, 2015
The GLM Procedure
Class Level Information
Class Levels Values
bloque 3 1 2 3
A 2 a1 a2
B 3 b1 b2 b3
Number of Observations Read 18
Number of Observations Used 18
Análisis de varianza de Parcelas Divididas 5
10:39 Thursday, July 17, 2015
The GLM Procedure
Dependent Variable: rdto
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 9 336.6666667 37.4074074 8.69 0.0029
Error 8 34.4444444 4.3055556
Corrected Total 17 371.1111111
R-Square Coeff Var Root MSE rdto Mean
0.907186 35.91317 2.074983 5.777778
Source DF Type I SS Mean Square F Value Pr > F
bloque 2 2.1111111 1.0555556 0.25 0.7882
A 1 0.2222222 0.2222222 0.05 0.8260
bloque*A 2 4.1111111 2.0555556 0.48 0.6370
B 2 29.7777778 14.8888889 3.46 0.0827
A*B 2 300.4444444 150.2222222 34.89 0.0001
Source DF Type III SS Mean Square F Value Pr > F
bloque 2 2.1111111 1.0555556 0.25 0.7882
A 1 0.2222222 0.2222222 0.05 0.8260
bloque*A 2 4.1111111 2.0555556 0.48 0.6370
B 2 29.7777778 14.8888889 3.46 0.0827
A*B 2 300.4444444 150.2222222 34.89 0.0001
Tests of Hypotheses Using the Type III MS for bloque*A as an Error Term
Source DF Type III SS Mean Square F Value Pr > F
A 1 0.22222222 0.22222222 0.11 0.7735
10:39 Thursday, July 17, 2015
The GLM Procedure
Dependent Variable: rdto
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 9 336.6666667 37.4074074 8.69 0.0029
Error 8 34.4444444 4.3055556
Corrected Total 17 371.1111111
R-Square Coeff Var Root MSE rdto Mean
0.907186 35.91317 2.074983 5.777778
Source DF Type I SS Mean Square F Value Pr > F
bloque 2 2.1111111 1.0555556 0.25 0.7882
A 1 0.2222222 0.2222222 0.05 0.8260
bloque*A 2 4.1111111 2.0555556 0.48 0.6370
B 2 29.7777778 14.8888889 3.46 0.0827
A*B 2 300.4444444 150.2222222 34.89 0.0001
Source DF Type III SS Mean Square F Value Pr > F
bloque 2 2.1111111 1.0555556 0.25 0.7882
A 1 0.2222222 0.2222222 0.05 0.8260
bloque*A 2 4.1111111 2.0555556 0.48 0.6370
B 2 29.7777778 14.8888889 3.46 0.0827
A*B 2 300.4444444 150.2222222 34.89 0.0001
Tests of Hypotheses Using the Type III MS for bloque*A as an Error Term
Source DF Type III SS Mean Square F Value Pr > F
A 1 0.22222222 0.22222222 0.11 0.7735
Análisis de varianza de Parcelas Divididas 6
10:39 Thursday, July 17, 2015
The GLM Procedure
Tukey's Studentized Range (HSD) Test for rdto
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher
Type II error rate than REGWQ.
Alpha 0.05
Error Degrees of Freedom 8
Error Mean Square 4.305556
Critical Value of Studentized Range 3.26115
Minimum Significant Difference 2.2556
Means with the same letter are not significantly different.
Tukey Grouping Mean N A
A 5.8889 9 a2
A
A 5.6667 9 a1
10:39 Thursday, July 17, 2015
The GLM Procedure
Tukey's Studentized Range (HSD) Test for rdto
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher
Type II error rate than REGWQ.
Alpha 0.05
Error Degrees of Freedom 8
Error Mean Square 4.305556
Critical Value of Studentized Range 3.26115
Minimum Significant Difference 2.2556
Means with the same letter are not significantly different.
Tukey Grouping Mean N A
A 5.8889 9 a2
A
A 5.6667 9 a1
Análisis de varianza de Parcelas Divididas 13
10:39 Thursday, July 17, 2015
The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
LSMEAN
B rdto LSMEAN Number
b1 4.00000000 1
b2 7.00000000 2
b3 6.33333333 3
Least Squares Means for effect B
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: rdto
i/j 1 2 3
1 0.0841 0.1875
2 0.0841 0.8461
3 0.1875 0.8461
10:39 Thursday, July 17, 2015
The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
LSMEAN
B rdto LSMEAN Number
b1 4.00000000 1
b2 7.00000000 2
b3 6.33333333 3
Least Squares Means for effect B
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: rdto
i/j 1 2 3
1 0.0841 0.1875
2 0.0841 0.8461
3 0.1875 0.8461
Análisis de varianza de Parcelas Divididas 14
10:39 Thursday, July 17, 2015
The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
LSMEAN
A B rdto LSMEAN Number
a1 b1 3.6666667 1
a1 b2 2.0000000 2
a1 b3 11.3333333 3
a2 b1 4.3333333 4
a2 b2 12.0000000 5
a2 b3 1.3333333 6
Least Squares Means for effect A*B
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: rdto
i/j 1 2 3 4 5 6
1 0.9110 0.0163 0.9983 0.0100 0.7391
2 0.9110 0.0050 0.7391 0.0032 0.9983
3 0.0163 0.0050 0.0268 0.9983 0.0032
4 0.9983 0.7391 0.0268 0.0163 0.5290
5 0.0100 0.0032 0.9983 0.0163 0.0021
6 0.7391 0.9983 0.0032 0.5290 0.0021
10:39 Thursday, July 17, 2015
The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
LSMEAN
A B rdto LSMEAN Number
a1 b1 3.6666667 1
a1 b2 2.0000000 2
a1 b3 11.3333333 3
a2 b1 4.3333333 4
a2 b2 12.0000000 5
a2 b3 1.3333333 6
Least Squares Means for effect A*B
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: rdto
i/j 1 2 3 4 5 6
1 0.9110 0.0163 0.9983 0.0100 0.7391
2 0.9110 0.0050 0.7391 0.0032 0.9983
3 0.0163 0.0050 0.0268 0.9983 0.0032
4 0.9983 0.7391 0.0268 0.0163 0.5290
5 0.0100 0.0032 0.9983 0.0163 0.0021
6 0.7391 0.9983 0.0032 0.5290 0.0021
INTERPRETACION:
1. No existen diferencias significativas entre los niveles del factor A
2. No existen diferencias significativas entre los niveles del factor B
3. Sí existe interacción entre A y B
4. De acuerdo a la prueba de Tukey para la interacción, los tratamientos con mayor rendimiento son a1b3 y a2b2
Muy buena presentación. ¿Cuáles son las instrucciones del Parcelas Divididas en un Diseño Completamentamente al Azar?
ResponderEliminarHola, pues en ese caso, como no hay interaccion bloque-tratamiento, se maneja como un simple factorial donde la parcela grande es el factor A, el tratamiento es la parcela pequeña (factor B)
ResponderEliminarlas instrucciones son asi:
Class A B;
Model rdto= A B A*B;
Means A B A*B/Tukey lines;
Run;