PRUEBAS DE NORMALIDAD CON INFOSTAT
Ing. Luis Manfredo Reyes
Casi toda la teoría de la estadística inferencial (pruebas
de hipótesis, regresión, análisis de varianza) ha sido construída sobre el
fundamento de que “LOS DATOS TIENEN DISTRIBUCIÓN NORMAL”, o dicho de otra
manera, para que la teoría sea válida, es necesario que los datos tengan
distribución normal.
Tristemente, la mayoría de investigadores simplemente
ignoran éste requisito y olímpicamente suponen que los datos sí tienen distribución
normal, cuando en la realidad no se sabe si esto es cierto.
Existen varias pruebas para determinar si los datos son
normales o no:
Chi cuadrado de bondad de ajuste
Kolmogorov Smirnoff
Shapiro y Wilks
No es el objetivo del presente documento explorar los
principios teóricos y métodos manuales de cálculo, sino ilustrar la utilización
del paquete Infostat para su
determinación.
Infostat es un paquete estadístico producido en la
Universidad de Córdoba, Argentina, que tiene la ventaja de estar escrito en
español, con versión comercial y libre. Se puede obtener en: www.infostat.com.ar
Se asume que el lector tiene instalado el paquete y conoce
el uso básico del mismo.
Ejemplo:
Deterrmine si el siguiente conjunto de datos tiene
distribución normal, a un nivel de confianza del 97%.
25
|
19
|
33
|
17
|
28
|
30
|
16
|
11
|
20
|
09
|
15
|
19
|
31
|
40
|
47
|
66
|
23
|
30
|
10
|
55
|
En infostat se crea el archivo colocando todos los datos en
una sola columna, llamándola por ejemplo x:
Se selecciona la variable a analizar:
Hipótesis nula: "Los datos tienen distribución normal"
Hipótesis alterna: "Los datos no tiernen distribución normal"
En ésta prueba, el estadístico calculado es W, y el programa presenta el valor de p correspondiente. En éste ejemplo, como el nivel de confianza es 97%, es decir 0.97, entonces el valor del nivel de significancia (alfa) es 0.03. Como el p es mayor que el alfa, se concluye que se acepta la hipótesis nula y por lo tanto los datos sí tienen distribución normal.
PRUEBA DE KOLMOGOROV SMIRNOFF
Se ingresa a: ESTADISTICAS->INFERENCIA BASADA EN UNA MUESTRA-> bondad de Ajuste (Kolmogorov)
Al ingresar la variable y dar click en Aceptar, el programa solicita qué distribución se está ajustando y con qué parámetros:
Se puede ingresar cualquier valor de media y varianza
y al ingresar los datos (por ejemplo: media 15 y varianza 5) y dar click en aceptar, presenta el siguiente resultado:
Hipótesis nula: "Los datos tienen distribución normal, con media 15 y varianza 5"
Hipótesis alterna: "Los datos no tiernen distribución normal con media 15 y varianza 5"
En ésta prueba, el estadístico calculado es D, y el programa presenta el valor de p correspondiente. Para el ejemplo, como el nivel de confianza es 97%, es decir 0.97, entonces el valor del nivel de significancia (alfa) es 0.03. Como el p es menor que 0.0001 , se concluye que se rechaza la hipótesis nula y por lo tanto los datos no tienen distribución normal con media 15 y varianza 5.
Se puede probar con otros valores de media y varianza.
LA DIFERENCIA ENTRE LAS PRUEBAS ES QUE EN SHAPIRO Y WILKS NO SE NECESITA CONOCER LA MEDIA Y VARIANZA, PERO EN KOLMOGOROV SMIRNOFF SI ES NECESARIO
No hay comentarios:
Publicar un comentario