jueves, 18 de septiembre de 2014

PRUEBAS DE NORMALIDAD CON INFOSTAT

PRUEBAS DE NORMALIDAD CON INFOSTAT
Ing. Luis Manfredo Reyes

Casi toda la teoría de la estadística inferencial (pruebas de hipótesis, regresión, análisis de varianza) ha sido construída sobre el fundamento de que “LOS DATOS TIENEN DISTRIBUCIÓN NORMAL”, o dicho de otra manera, para que la teoría sea válida, es necesario que los datos tengan distribución normal.
Tristemente, la mayoría de investigadores simplemente ignoran éste requisito y olímpicamente  suponen que los datos sí tienen distribución normal, cuando en la realidad no se sabe si esto es cierto.


Existen varias pruebas para determinar si los datos son normales o no:
Chi cuadrado de bondad de ajuste
Kolmogorov Smirnoff
Shapiro y Wilks

No es el objetivo del presente documento explorar los principios teóricos y métodos manuales de cálculo, sino ilustrar la utilización del  paquete Infostat para su determinación.

Infostat es un paquete estadístico producido en la Universidad de Córdoba, Argentina, que tiene la ventaja de estar escrito en español, con versión comercial y libre. Se puede obtener en: www.infostat.com.ar
Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.
Ejemplo:
Deterrmine si el siguiente conjunto de datos tiene distribución normal, a un nivel de confianza del 97%.
25
19
33
17
28
30
16
11
20
09
15
19
31
40
47
66
23
30
10
55

En infostat se crea el archivo colocando todos los datos en una sola columna, llamándola por ejemplo x:





PRUEBA DE SHAPIRO Y WILKS:

Se ingresa a: ESTADISTICAS->INFERENCIA BASADA EN UNA MUESTRA-> SHAPIRO Y WILKS

Se selecciona la variable a analizar:

y al dar click sobre Aceptar, se produce el siguiente resultado:

Hipótesis nula: "Los datos tienen distribución normal"
Hipótesis alterna: "Los datos no tiernen distribución normal"
En ésta prueba, el estadístico calculado es W, y el programa presenta el valor de p correspondiente. En éste ejemplo, como el nivel de confianza es 97%, es decir 0.97, entonces el valor del nivel de significancia (alfa) es 0.03. Como el p es mayor que  el alfa, se concluye que se acepta la hipótesis nula y por lo tanto los datos sí tienen distribución normal. 

PRUEBA DE KOLMOGOROV SMIRNOFF
Se ingresa a: ESTADISTICAS->INFERENCIA BASADA EN UNA MUESTRA-> bondad de Ajuste (Kolmogorov)

Al ingresar la variable y dar click en Aceptar, el programa solicita qué distribución se está ajustando y con qué parámetros:

Se puede ingresar cualquier valor de media y varianza
y al ingresar los datos (por ejemplo: media 15 y varianza 5) y dar click en aceptar, presenta el siguiente resultado:
Hipótesis nula: "Los datos tienen distribución normal, con media 15 y varianza 5"
Hipótesis alterna: "Los datos no tiernen distribución normal con media 15 y varianza 5"
En ésta prueba, el estadístico calculado es D, y el programa presenta el valor de p correspondiente. Para el ejemplo, como el nivel de confianza es 97%, es decir 0.97, entonces el valor del nivel de significancia (alfa) es 0.03. Como el p es menor que 0.0001 , se concluye que se rechaza  la hipótesis nula y por lo tanto los datos no tienen distribución normal con media 15 y varianza 5.
Se puede probar con otros valores de media y varianza.

LA DIFERENCIA ENTRE LAS PRUEBAS ES QUE EN SHAPIRO Y WILKS NO SE NECESITA CONOCER LA MEDIA Y VARIANZA, PERO EN KOLMOGOROV SMIRNOFF SI ES NECESARIO

No hay comentarios:

Publicar un comentario