PRUEBA DE HIPÓTESIS PARA DATOS
APAREADOS CON GEOGEBRA
Ing. Luis Manfredo Reyes
Un tema obligado en los cursos
de estadística inferencial es el de la prueba de hipótesis para datos apareados
(o pares coincidentes como le llaman en algunos libros). No es el objetivo de
éste documento profundizar en la metodología manual para la resolución de éste
tipo de pruebas, sino auxiliar al investigador con la tecnología informática
disponible.
Esta
prueba puede ser realizada en Geogebra con mucha facilidad.
GeoGebra es
un software matemático. Fue creado con la idea de ser usado para la educación en colegios y universidades.
Fue creado por Markus Hohenwarter, en el año 2001 en la Universidad
de Salzburgo, luego en la Universidad de Atlantic, Florida, luego en la Universidad Estatal de Florida y actualmente , en la Universidad de Linz, Austria.
El software tiene dos
partes importantes: un procesador geométrico y un procesador algebraico.
GeoGebra permite el
trazado de construcciones geométricas de todo tipo así como la representación
gráfica, el tratamiento algebraico y el cálculo de funciones reales de variable
real, sus derivadas, integrales, etc.
DISPONIBILIDAD:
Existen versiones para:
Windows, Linux, MacIntosh, Android e Ios.
Existen algunas diferencias
entre las versiones, pero la mayoría de aspectos son iguales.
La última versión disponible
es la 5.
En éste artículo se muestran
aplicaciones del Geogebra en el tema de pruebas de hipótesis para datos
apareados, , partiendo de un ejemplo
clásico de cualquier curso de estadística inferencial
Se asume que el usuario tiene
instalado el programa y conoce el uso básico del mismo
Ejemplo:
Un investigador compara las
calificaciones de diez estudiantes antes y después de tomar una cápsula a base
de Ginkgo biloba (que se supone mejora la inteligencia) durante un tiempo. En
base a los resultados indique con un 97% de confianza si el uso de las cápsulas
produce una mejora en los resultados.
Porqué los datos son apareados? porque cada persona es evaluada antes y
después de tomar la pastilla (es decir, se tienen dos datos de la misma
persona)
La Hipótesis a evaluar sería:
HO: el promedio de las diferencias es de 0 puntos
Ha: el promedio de las diferencias no es cero (dos colas)
DE ACUERDO AL CRITERIO DEL INVESTIGADOR, LA HIPOTESIS ALTERNA SE PUEDE
PLANTEAR TANTO A UNA COMO A DOS COLAS
Resultados finales:
Paso 1: Crear la tabla de datos en Geogebra:
Se activa la vista de hoja de cálculo y se ingresan los datos por
columnas:
Se da click sobre la letra A de la primera columna y se da click en el
ícono de las barras, seleccionando la opción Análisis Multivariable.
En la ventana de selección aparece lo siguiente:
Se da click sobre el signo +, se da click sobre la letra B en la segunda
columna y luego click sobre el ícono de la manita en la columna B de la ventana
Fuente de datos
Se da click sobre el botón Analiza:
Aparece una gráfica de cajitas. Se da click sobre el símbolo de
sumatoria y aparecen los promedios
En la pestaña Estadísticas, escoger Test T, diferencias pareadas.
Aparece lo siguiente:
Interpretación: Como el nivel de confianza es de 97% (0.97), entonces el
nivel de significancia (alfa) es 0.03. Pero al usar la hipótesis alterna de no
igualdad, se debe dividir entre 2 (0.015) . El valor de p es mayor que 0.015
por lo que se acepta la hipótesis nula. Es decir que el producto no produce una
mejora significativa en la memoria de los participantes del estudio.
DESDE LA VISTA ALGEBRAICA
En versiones para teléfono o Tablet no existe la vista de
hoja de cálculo, pero sí es posible realizar el procedimiento.
1.
Crear las listas de datos:
L1={45,52,61,33,49,75,64,39,34,60}
L2={48,55,59,33,54,80,64,39,53,68}
2.
Invocar la orden para ejecutar la prueba:
TestApareadasT[L1,L2, "≠"]
En este caso, se decidió usar la hipótesis
alterna de no igualdad, por lo cual el símbolo no igual se obtiene dando click
en el símbolo alfa que aparece en la línea de entrada y escogiendo el símbolo,
que debe quedar entre comillas
El resultado que se produce es la
significancia y el valor de la t calculada
La interpretación es la misma que en el caso
anterior.
Interpretación: Como el nivel de confianza es de 97% (0.97), entonces el
nivel de significancia (alfa) es 0.03. Pero al usar la hipótesis alterna de no
igualdad, se debe dividir entre 2 (0.015) . El valor de p es mayor que 0.015
por lo que se acepta la hipótesis nula. Es decir que el producto no produce una
mejora significativa en la memoria de los participantes del estudio.
No hay comentarios:
Publicar un comentario