lunes, 23 de mayo de 2016

ANÁLISIS DE REGRESIÓN MÚLTIPLE POR EL MÉTODO MATRICIAL EN GEOGEBRA

ANÁLISIS DE REGRESIÓN MÚLTIPLE POR EL MÉTODO MATRICIAL EN GEOGEBRA
Ing. Luis Manfredo Reyes
El objetivo de la técnica de regresión múltiple es, explicar una variable dependiente (y) en función de un conjunto de variables independientes (x).

No es el propósito de éste documento profundizar en la metodología manual para la resolución de éste tipo de pruebas, sino auxiliar al investigador con la tecnología informática disponible.

Este análisis puede ser realizada en Geogebra. Sin embargo se debe aclarar que no existe un procedimiento directo para los cálculos, sino debe usarse el procedimiento matricial  



GeoGebra es un software matemático. Fue creado con la idea de ser usado  para la educación en colegios y universidades. Fue creado por Markus Hohenwarter, en el año 2001 en la Universidad de Salzburgo, luego en la Universidad de Atlantic, Florida, luego en la Universidad Estatal de Florida y actualmente , en la Universidad de Linz, Austria.
GeoGebra está escrito en Java y por tanto es posible usarlo en diferentes plataformas.
El software tiene dos partes importantes: un procesador geométrico y un procesador algebraico.
GeoGebra permite el trazado de construcciones geométricas de todo tipo así como la representación gráfica, el tratamiento algebraico y el cálculo de funciones reales de variable real, sus derivadas, integrales, etc.
DISPONIBILIDAD:
El software puede ser descargado sin costo del sitio: www.geogebra.org 
Existen versiones para: Windows, Linux, MacIntosh, Android e Ios.
Existen algunas diferencias entre las versiones, pero la mayoría de aspectos son iguales.
La última versión disponible es la 5.

En éste artículo se muestran aplicaciones del Geogebra en el tema de regresión múltiple , ,  partiendo de un ejemplo clásico de cualquier curso de estadística inferencial

Se asume que el usuario tiene instalado el programa y conoce el uso básico del mismo
Ejemplo  Una desea estimar los gastos en alimentación de una familia (Y) en base a la información que proporcionan las variables regresoras X1 =“ingresos mensuales” y X2 =“número de miembros de la familia”. Para ello se recoge una muestra aleatoria simple de 15 familias cuyos resultados son los de la tabla adjunta
(El gasto e ingreso está dado en cientos de miles )






Gasto
Ingreso
Tamaño
Gasto
Ingreso
Tamaño






0.'43
2.1
3
1.9
8'9
3






0.'31
1.1
4
0'.35
2'4
2






0.'32
0'9
5
0'.35
1'2
4






0.'46
1'6
4
0'.78
4'7
3






1.'25
6'2
4
0'.43
3'5
2






0.'44
2'3
3
0'.47
2'9
3






0.'52
1'8
6
0'..8
1'4
4






0.'29
1'0
5






DESDE LA VISTA HOJA DE CÁLCULO:
Crear la matriz X y el vector y (para la matriz x, la primera columna debe ser un número 1)









Para la estimación de la ecuación se usa la siguiente operación matricial:
B=(x´x)-1*(x´y)
Que en geogebra se especifica así:




La ecuación queda así= y=-0.56+0.1x1+0.27x2
Para determinar la calidad de la ecuación se procede a calcular el coeficiente de determinación:
La operación que se realiza es: B´(x´y) / y´y
Que en Geogebra se especifica así:
Numerador:
Traspone[matriz3]*(Traspone[matriz1]*matriz1)
El resultado es 11.07 y se almacena en Matriz4
Denominador
(Traspone[matriz2]*matriz[2])
El resultado es 16.69 y se almacena en matriz5
Se dividen los resultados
11.07/16.69= 0.66



El valor del coeficiente de determinación (0.66)  indica que hay un bajo ajuste de los datos al modelo, por lo que no se recomienda utilizarlo para fines de predicción de resultados
En realidad, hay otros programas que realizan el análisis de forma más directa, pero al final Geogebra también lo puede realizar


No hay comentarios:

Publicar un comentario