DATOS PERDIDOS EN EL DISEÑO DE BLOQUES AL AZAR
MÉTODO PARA EL MANEJO DE LOS DATOS PERDIDOS EN EL ANÁLISIS
De vez en cuando ciertas observaciones se pierden, ya sea por no haberlas tomado, ya sea por errores grandes al tomarlas o por accidente. La omisión naturalmente afecta al método de análisis. Con cada uno de los diseños comunes se dan instrucciones de cálculo para analizar los datos que contengan errores.
Cuando faltan ciertas observaciones, el procedimiento correcto es señalar un modelo matemático para todas las observaciones que haya. Las ecuaciones normales de mínimos cuadrados se construyen entonces por el método usual. Estas toman exactamente la forma general, como en el caso en que se tuvieran en cuenta todas las observaciones, esto es,
De todas las observaciones cuyas ecuaciones contengan algún parámetro especifico por estimar. Sin embargo, puesto que los términos correspondientes a los valores que están perdidos no están a la vista en la ecuación, el sistema de ecuaciones pierde algo de la simetría que posee cuando todos los están y las soluciones son más difíciles. El mismo procedimiento general proporciona las pruebas de hipótesis de F y t con relación a la naturaleza de los efectos de los tratamientos, aunque nuevamente los detalles llegan a ser mas complicados.
En el análisis de la varianza pueden notarse dos cambios. Debido a las observaciones perdidas, la s.c de los tratamientos y de los bloques se mezclan, de tal forma que la s.c de los tratamientos debe ser calculada después de tener los efectos de bloques, como se menciono al final.
En segundo lugar, si faltan a observaciones, el numero total de grados de libertad se reduce en a. A menos que una o más tratamientos o bloques completos estén perdidos, el numero de parámetros requeridos para describir estos efectos será el mismo que antes. En consecuencia, todos los grados de libertad perdidos, afectan a la s.c. del error, que ahora representa (ne – a) grados de libertad. En resumen, los datos perdidos pueden ser manejados aplicando el procedimiento estándar de mínimos cuadrados a todas las observaciones que no estén perdidas. Para referencias futuras, este métodos será llamado “procedimiento correcto de mínimos cuadrados”.
Para el experimentador puede ser un asunto difícil llevar a cabo la construcción y la solución de un conjunto de ecuaciones normales que no le son familiares, aunque él sea muy competente para analizar un conjunto de datos completos.
DATOS PERDIDOS EN BLOQUES AL AZAR
El diseño en bloques al azar debe ser balanceado. Pueden suceder los siguientes casos
A) Se pierde todo un tratamiento. Solución: se analiza el experimento con un tratamiento menos.
B) Se pierde todo un bloque. Solución: se analiza el experimento con un bloque menos
C) Se pierden algunas unidades experimentales (existen tres casos)
Que se pierda una unidad, que se pierdan dos unidades o que se pierdan tres unidades, si se pierden mas de tres unidades experimentales, se debe repetir el experimento.
PRIMER CASO ( Se pierde una unidad experimental)
Cuando se pierde una unidad experimental se aplica el siguiente modelo de estimación:
Yij = rB +tT - S
donde
Yij = Estimación del dato perdido
r = Numero de repeticiones
B = Total del bloque donde falta el dato
T = Total del tratamiento donde falta el dato
t = Numero de tratamientos
S = Gran total Y..
El dato estimado se coloca en donde falta el dato y se calcula el andeva de forma usual. Pero se resta un grado de libertad al error y al total y se recalcula el cuadrado medio del error y la F
Ejemplo.
I
|
II
|
III
|
IV
|
TOTALES
| |
1
|
1
|
4
|
5
|
2
|
12
|
2
|
5
|
7
|
Y
|
4
|
16
|
3
|
8
|
8
|
8
|
8
|
32
|
4
|
7
|
6
|
7
|
2
|
22
|
21
|
25
|
20
|
16
|
82
| |
r = 4
| |||||
t = 4
| |||||
Y =
|
4(20) + 4(16) - 82
|
=
|
6.88888
| ||
(4 - 1) *(4 - 1)
|
Grados de Libertad del error ajustados: (4-1)(4-1)-1=8
Grados de libertad del total ajustados: (4*4-1)-1=14
SEGUNDO CASO ( Se pierden dos unidades experimentales)
Cuando se pierde dos unidades experimentales (x,y) se aplica el siguiente método
a) Estimación inicial de X
X = T + B
donde
T = Promedio del tratamiento donde falta X
B = Promedio del bloque donde falta X
b) Teniendo X estimar Y
Y = rBy +tTy - S
c) Teniendo Y estimar X
Y = rBx +tTx - S
donde
Y ó X = Estimación del dato perdido
R = Numero de repeticiones
B = Total del bloque donde falta el dato de x o de y
T = Total del tratamiento donde falta el dato
t = Numero de tratamientos
S = Gran total Y..+ el dato previamente estimado de x ó y
d) Repetir los pasos b) y c) hasta que los resultados sean constantes
Los datos se colocan donde faltan los datos perdidos y se recalcula el andeva, restándole 2 grados de libertad al error y 2 grados de libertad al total.
Ejemplo:
| ||||||||||
I
|
II
|
III
|
IV
|
TOTALES
| ||||||
1
|
42
|
40
|
35
|
40
|
157
| |||||
2
|
25
|
28
|
X
|
28
|
81
| |||||
3
|
Y
|
45
|
42
|
40
|
127
| |||||
4
|
30
|
30
|
30
|
30
|
120
| |||||
5
|
30
|
32
|
31
|
34
|
127
| |||||
127
|
175
|
138
|
172
|
612
| ||||||
Estimación inicial de x
| ||||||||||
x= ((138/4)+(81/3))/2=30.75 | ||||||||||
Para Facilitar los cálculos se recomienda construir la siguiente tabla:
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
:
TERCER CASO ( Se pierden tres unidades experimentales (X,Y,Z)
Cuando se pierde tres unidades experimentales (X,Y,Z) se aplica el siguiente método
a) Estimación inicial de
X = Tx + Bx
Y = Ty + By
donde
T = Promedio del tratamiento donde falta X o Y
B = Promedio del bloque donde falta X o Y
b) Conociendo X,Y estimar Z
Z = rB +tTZ - S
c) Conociendo Y,Z estimar X
X = rB +tT - S
d) Conociendo X,Z estimar Y
Y = rB +tT - S
Z ó Y ó X = Estimación del dato perdido
R = Numero de repeticiones
B = Total del bloque donde falta el dato de x o y o z
T = Total del tratamiento donde falta el dato x, y o z
t = Numero de tratamientos
S = Gran total Y..+ el dato previamente estimado de x ó y ó z
(para x: y+z, para y: x+z, para z: x+y)
e) Repetir los pasos b) c) y d) hasta que los resultados sean constantes.
Se calcula el andeva de forma usual, restando 3 grados de libertad al error y 3 grados de libertad al total y se recalcula el cuadrado medio del error y la F calculada
Ejemplo:
I | II | III | IV | TOTALES | |
1 | 42 | 40 | 35 | 40 | 157 |
2 | 25 | 28 | X | 28 | 81 |
3 | Y | 45 | 42 | 40 | 127 |
4 | 30 | 30 | 30 | 30 | 120 |
5 | 30 | 32 | 31 | Z | 93 |
127 | 175 | 138 | 138 | 578 |
Estimación inicial de x: ((138/4)+(83/3))/2=30.75
Estimación inicial de y: ((127/4)+(130/3))/2=37.041
Tabla de cálculos abreviados:
B | T | S | X | Y | Z |
138 | 93 | 645.7917 | 30.9340 | ||
138 | 81 | 645.9757 | 25.9187 | ||
127 | 127 | 634.8527 | 42.3456 | ||
138 | 93 | 646.2643 | 30.8946 | ||
138 | 81 | 651.2402 | 25.4800 | ||
127 | 127 | 634.3746 | 42.3854 | ||
138 | 93 | 645.8654 | 30.9279 | ||
138 | 81 | 651.3133 | 25.4739 | ||
127 | 127 | 634.4018 | 42.3832 | ||
138 | 93 | 645.8571 | 30.9286 | ||
138 | 81 | 651.3118 | 25.4740 | ||
127 | 127 | 634.4026 | 42.3831 | ||
138 | 93 | 645.8571 | 30.9286 | ||
138 | 81 | 651.3117 | 25.4740 |
Datos finales:
x=25.4740
y=42.3831
z=30.9286
Grados de libertad del error corregidos: (4-1)*(5-1)-3= 9
Grados de libertad total corregidos: (4*5-1)-3=16
No hay comentarios:
Publicar un comentario