martes, 20 de mayo de 2014

ANÁLISIS DE CONTRASTES ORTOGONALES CON R


ANÁLISIS DE CONTRASTES ORTOGONALES CON R
Ing. Luis Manfredo Reyes

En un análisis de varianza ordinario, se prueba la hipótesis que "Todos los tratamientos son iguales". En el caso de encontrar diferencias significativas, se debe proceder a realizar una prueba adicional, llamada Prueba de Medias.
Sin embargo, a veces se desea comparar grupos de tratamientos. Aquí es donde se emplea la prueba de Contrastes Ortogonales.
Existe mucha literatura disponible sobre los detalles de la prueba, pero el objetivo en el presente documento es mostrar cómo se realiza dicha prueba utilizando el paquete R.



Para ello, se parte del siguiente ejercicio:

Tres profesores utilizan distintos métodos de enseñanza con estudiantes repitentes de matemática I.  CARLOS usa el método tradicional (pizarrón y marcadores) , JUAN un método participativo y MARÍA  un método computarizado. Al final del semestre se comparan las calificaciones obtenidas (la nota máxima posible es 100 puntos)

PROF.        CALIFICACIONES:
   45
    66
    78
    23
     18
   55
    48
JUAN
   33
     38
     69
     17
     55
   66
     48
MARÍA
   60
     59
     88
     48
     76
    17
     90

a)      pruebe la hipótesis de que las calificaciones son iguales para cada profesor (µ= 1%)

b)      Plantee dos contrastes que sean prácticos y analícelos.

Primero , se definen las subhipótesis y sus coeficientes:
El número máximo de comparaciones es t-1= 3-1=2

Primera subhipótesis: Método tradicional contra métodos modernos
T1=T2+T3
2T1-T2-T3=0
[2  -1  -1]
Segunda subhipótesis: Método participativo versus método computarizado
T2=T3
T2-T3=0
[0 1 -1]   (el coeficiente de T1 es cero porque no participa en la comparación)

Luego, se debe crear el archivo de datos en R. En éste ejemplo, la creación del archivo se hará EN Microsoft Excel y será almacenado en formato CSV (texto separado por comas). Se crea una columna para cada contraste, donde se colocan los coeficientes de cada tratamiento.




Se leen los datos en R importando tabla de texto
Datos <- read.table("E:/CONTRASTE.csv", header=TRUE, sep=",")
En el ejemplo el archivo está localizado en la memoria USB (unidad E)


Declarar como factores las variables C1 y C2
Esto es importante para que sean reconocidos como variables independientes

Datos$C1 <- factor(Datos$C1, labels=c('-1','2'))
Datos$C2 <- factor(Datos$C2, labels=c('-1','0','1'))

Especificar el andeva
AnovaModel.1 <- aov(NOTA ~ PROFESOR, data=Datos)
summary(AnovaModel.1)

summary(AnovaModel.1)
                      Df Sum Sq Mean Sq F value Pr(>F)
PROFESOR     2   1125   562.3     1.153  0.338
Residuals     18   8779   487.7         

Andeva para los contrastes
AnovaModel.2 <- aov(NOTA ~ C1, data=Datos)
summary(AnovaModel.2)
                 Df Sum Sq Mean Sq F value Pr(>F)
C1               1    229   228.7   0.449  0.511
Residuals   19   9675   509.2              
> 
Eliminar los datos que tienen coeficiente cero  (filas 1 a 7 del archivo) y nombrarlo como Datos2
 Datos2 <- Datos[-c(1,2,3,4,5,6,7),]
Nuevamente definir C2 como factor
Datos2$C2 <- factor(Datos$C2, labels=c('-1','1'))
AnovaModel.3 <- aov(NOTA ~ C2, data=Datos2)

ssummary(AnovaModel.3)
                 Df Sum Sq Mean Sq F value Pr(>F)
C2              1    896   896.0     1.8  0.205
Residuals   12   5973   497.8               





CONCLUSIONES DEL ANÁLISIS
1. Como en el Andeva el p es mayor que el alfa (0.01), se concluye que todos los métodos producen el mismo resultado
2. Para el primer contraste, como el p es mayor que el alfa, se concluye que el método tradicional produce el mismo resultado que los métodos modernos
participativo produce el mismo resultado que el método computarizado
4. El coeficiente de variación obtenido indica que hay fuentes de variación que no fueron controladas apropiadamente. (ES UN ERROR DECIR COMO ALGUNOS PROFESORES ENSEÑAN QUE HUBO MAL MANEJO DEL EXPERIMENTO)....

RECOMENDACION: Seguir usando el método de pizarrón y marcadores, ya que los nuevos métodos no mejoran las notas, además posiblemente tengan costos más elevados.


No hay comentarios:

Publicar un comentario