ANÁLISIS GRÁFICO DE BONDAD DE AJUSTE A LA
DISTRIBUCIÓN NORMAL CON SAS
Ing. Luis Manfredo Reyes
Cuando se analiza un conjunto de datos, usualmente
se asume que los datos tienen una distribución normal. Tomando en cuenta que
casi toda la estadística inferencial está basada en ésta condición, es
importante realizar la comprobación respectiva, si los datos se adaptan a
alguna distribución teórica. Hay técnicas analíticas que permiten la
comprobación (Kolmogorov, Chi Cuadrado, Shapiro), pero también hay métodos
gráficos que lo hacen.
En ésta ocasión se muestra como comprobar
gráficamente si un conjunto de datos se aproxima a una distribución normal
teórica, usando SAS
El software SAS (Statistical Analisys System) ha
sido considerado como el más potente para análisis estadístico, pero siempre
tuvo el gran inconveniente de su elevado costo (se paga una licencia anual).
Afortunadamente, en una decisión sorpresiva pero
agradable, el CEO de SAS decidió liberar el software para uso de estudiantes,
profesores e investigadores (más información de cómo obtener el software aquí: http://reyesestadistica.blogspot.com/2015/06/milagro-sas-libera-version-gratuita.html
Se asume que el lector tiene instalado el paquete y
conoce el uso básico del mismo.
DATOS DE EJEMPLO:
En la Facultad de
Ciencias Químicas y Farmacia se realizó un diagnóstico de conocimientos de
matemática y física de todos los estudiantes de primer ingreso en el año 1996.
Los datos están contenidos en el archivo de Excel "Nuevos2" que
puede ser descargado del siguiente enlace:
En éste ejemplo, la
variable de interés es la nota total obtenida (en la escala de 0 a 100, donde
100 es la máxima nota posible). El archivo puede ubicarse en cualquier parte,
pero lo más fácil es en el directorio raíz (c:\)
1. Importar los datos
a SAS
En la ventana EDITOR de SAS se ingresa:
En la ventana EDITOR de SAS se ingresa:
Proc import
datafile=”c:\nuevos2.xls out=nuevos2 dbms=xls replace; getnames=yes; run;
Datafile define la
ubicación del archivo a importar
Out define el
nombre del archivo de trabajo de SAS (puede ser cualquier nombre)
Dbms define el tipo
de archivo a importar, en éste caso es xls (Excel)
Replace indica que
se debe remplazar cualquier archivo con el mismo nombre
Getnames indica que
se deben leer los datos de la primera fila como los nombres de las variables
2. Especificar el
diagrama QQ-Plot:
title "Grafica
QQ para chequeo de normalidad";
proc univariate data=nuevos2;
qqplot total;
run;
Todas las instrucciones se escriben en la ventana EDITOR y luego en la pestaña RUN se escoge la opción SUBMIT.
El resultado obtenido es el siguiente:
Como la
mayoría de datos están muy cerca de formar una línea recta, entonces se concluye que sí hay
distribución normal en los datos
No hay comentarios:
Publicar un comentario