miércoles, 11 de mayo de 2016

ANÁLISIS DE REGRESIÓN LINEAL, GEOMÉTRICA, LOGARÍTMICA Y CUADRÁTICA EN GEOGEBRA

ANÁLISIS DE REGRESIÓN LINEAL, GEOMÉTRICA, LOGARÍTMICA Y CUADRÁTICA EN GEOGEBRA

Ing. Luis Manfredo Reyes

El análisis de regresión es una técnica estadística que trata de encontrar un modelo matemático que explique los cambios en una variable (dependiente) en función de otra u otras (independiente o independientes).

Aunque el modelo más enseñado y más utilizado es el lineal (y=a+bx), hay muchas situaciones donde éste modelo no se adapta bien a los datos, surgiendo la necesidad de probar otros modelos.

Afortunadamente, la tecnología disponible actualmente permite el ajuste de muchos modelos con los mismos datos. En ésta ocasión se discute el uso de GEOGEBRA para el ajuste.


GeoGebra es un software matemático. Fue creado con la idea de ser usado  para la educación en colegios y universidades. Fue creado por Markus Hohenwarter, en el año 2001 en la Universidad de Salzburgo, luego en la Universidad de Atlantic, Florida, luego en la Universidad Estatal de Florida y actualmente , en la Universidad de Linz, Austria.
GeoGebra está escrito en Java y por tanto es posible usarlo en diferentes plataformas.
El software tiene dos partes importantes: un procesador geométrico y un procesador algebraico.
GeoGebra permite el trazado de construcciones geométricas de todo tipo así como la representación gráfica, el tratamiento algebraico y el cálculo de funciones reales de variable real, sus derivadas, integrales, etc.
DISPONIBILIDAD:
El software puede ser descargado sin costo del sitio: www.geogebra.org 
Existen versiones para: Windows, Linux, MacIntosh, Android e Ios.
Existen algunas diferencias entre las versiones, pero la mayoría de aspectos son iguales.
La última versión disponible es la 5.

En éste artículo se muestran aplicaciones del Geogebra en el tema de regresión, partiendo de un  ejemplo clásico de cualquier curso del tema.
Se asume que el lector ya instaló el software y conoce su uso básico.

Estudio de caso:
Se tienen los registros de población de una comunidad a partir de su fundación (tiempo cero):
AÑO
POBLACION
0
200
25
425
50
950
70
2200
100
5000

1.       Creación del archivo de datos
Para el modelo lineal se ingresan los datos tal y como están originalmente
La variable independiente es el año (x) y la dependiente la población (y)

OJO, NI X NI Y PUEDEN SER CERO ÉSTE DATO NO PUEDE VALER CERO, PORQUE EL LOGARITMO DE CERO NO EXISTE, EN SU LUGAR SE USA UN VALOR MUY PEQUEÑO POR EJEMPLO  0.000001)
Los datos se ingresan en la hoja de cálculo, o bien se pueden ingresar en Excel y luego copiarlas.



Se da click en el ícono que tiene unas barras o una línea con puntos, y escoger la opción: regresión con 2 variables.

Ojo: en éste ejemplo se ingresaron en la primera fila los nombres de las variables (x,y)
En tal caso, en la ventana fuente de datos se debe dar click en el símbolo del engranaje e indicar que la primera fila es el nombre de las variables



Si no se ingresaron en la primera fila los nombres de las columnas no es necesario realizar éste ajuste
Se marca la primera columna (A) y se da click sobre el ícono de la mano en la primera columna
Luego se marca la segunda columna (B) y se da click sobre el ícono de la mano en la segunda columna
Posteriormente se da click en Analiza





El programa presenta el diagrama de dispersión. Para ver el modelo se da click sobre el botón modelo y se escoge lineal.




Para ver las estadísticas importantes (en especial el coeficiente de determinación), se da click sobre el símbolo de sumartoria.




La información más importante es: el coeficiente de determinación (0.849). Este datos se debe comparar con el de los otros modelos para escoger el mejor.


Modelo geométrico 
Al escoger Regresión dos dos variables, se marcan las columnas x, y y se da click en analiza, luego,  en la pestaña de modelo se escoge exponencial, y se da click en el símbolo de sumatoria para que muestre las estadísticas

El grado de ajuste es de 0.99

Modelo logarítmico
Al escoger Regresión dos dos variables, se marcan las columnas x, y y se da click en analiza, luego , en la pestaña de modelo se escoge Log, y se da click en el símbolo de sumatoria para que muestre las estadísticas




Puede verse que el coeficiente de determinación es muy bajo por lo que debe ser desechado

Modelo cuadrático

Al escoger Regresión dos dos variables, se marcan las columnas x, y y se da click en analiza, luego se escoge Analiza, en la pestaña de modelo se escoge Polinomio, donde pregunta el grado se ingresa 2 , y se da click en el símbolo de sumatoria para que muestra las estadísticas.
Se pueden ajustar polinomios de otros grados, ingresando el grado en la casilla correspondiente.

El grado de ajuste es muy bueno (0.9973)

Como hay dos modelos que tienen casi el  mismo r cuadrado, el criterio que se aplica es seleccionar el que sea matemáticamente más simple, es decir el cuadrático
Existen otros modelos que pueden ser ajustados: crecimiento, senoidal y logístico.


No hay comentarios:

Publicar un comentario