viernes, 26 de septiembre de 2014

PRUEBA DE HIPÓTESIS PARA DATOS APAREADOS EN R

PRUEBA DE HIPÓTESIS PARA DATOS APAREADOS EN R
Ing. Luis Manfredo Reyes

Un tema obligado en los cursos de estadística inferencial es el de la prueba de hipótesis para datos apareados (o pares coincidentes como le llaman en algunos libros). No es el objetivo de éste documento profundizar en la metodología manual para la resolución de éste tipo de pruebas, sino auxiliar al investigador con la tecnología informática disponible.


Esta prueba puede ser realizada en R, con mucha facilidad.
R es un paquete estadístico producido  en el proyecto GNU , y se puede descargar en éste link:

http://www.r-project.org/


Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.


Ejemplo:
Un investigador compara las calificaciones de diez estudiantes antes y después de tomar una cápsula a base de Ginkgo biloba (que se supone mejora la inteligencia) durante un tiempo. En base a los resultados indique con un 97% de confianza si el uso de las cápsulas produce una mejora  en los resultados.

Porqué los datos son apareados? porque cada persona es evaluada antes y después de tomar la pastilla (es decir, se tienen dos datos de la misma persona)

La Hipótesis a evaluar sería:
HO: el promedio de las diferencias es de 0 puntos
Ha: el promedio de las diferencias no es cero (dos colas)

DE ACUERDO AL CRITERIO DEL INVESTIGADOR, LA HIPOTESIS ALTERNA SE PUEDE PLANTEAR TANTO A UNA COMO A DOS COLAS


Resultados finales:


Paso 1: tomando en cuenta que son pocos datos, se recomienda el ingreso vectorial:
> antes <-c(45,52,61,33,49,75,64,39,54,60)

> despues <-c(48,55,59,33,54,80,64,39,53,68)

Invocar la función t.test:

> t.test(antes,despues,paired=TRUE)

Y los resultados que R produce son:

      Paired t-test

data:  antes and despues 
t = -2.067, df = 9, p-value = 0.0687
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -4.3983141  0.1983141 
sample estimates:
mean of the differences     -2.1 

Interpretación: Como el nivel de confianza es de 97% (0.97), entonces el nivel de significancia (alfa) es 0.03. El valor de la significancia p  (0.0687)  es mayor que 0.03 por lo que se acepta la hipótesis nula. Es decir que el producto no produce una mejora significativa en la memoria de los participantes del estudio. 

No hay comentarios:

Publicar un comentario