miércoles, 8 de julio de 2015

ANÁLISIS GRÁFICO DE BONDAD DE AJUSTE A LA DISTRIBUCIÓN NORMAL CON SAS



ANÁLISIS GRÁFICO DE BONDAD DE AJUSTE A LA DISTRIBUCIÓN NORMAL CON SAS
Ing. Luis Manfredo Reyes

Cuando se analiza un conjunto de datos, usualmente se asume que los datos tienen una distribución normal. Tomando en cuenta que casi toda la estadística inferencial está basada en ésta condición, es importante realizar la comprobación respectiva, si los datos se adaptan a alguna distribución teórica. Hay técnicas analíticas que permiten la comprobación (Kolmogorov, Chi Cuadrado, Shapiro), pero también hay métodos gráficos que lo hacen.

En ésta ocasión se muestra como comprobar gráficamente si un conjunto de datos se aproxima a una distribución normal  teórica, usando SAS



El software SAS (Statistical Analisys System) ha sido considerado como el más potente para análisis estadístico, pero siempre tuvo el gran inconveniente de su elevado costo (se paga una licencia anual).
Afortunadamente, en una decisión sorpresiva pero agradable, el CEO de SAS decidió liberar el software para uso de estudiantes, profesores e investigadores (más información de cómo obtener el software aquí: http://reyesestadistica.blogspot.com/2015/06/milagro-sas-libera-version-gratuita.html

Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.

DATOS DE EJEMPLO:
En la Facultad de Ciencias Químicas y Farmacia se realizó un diagnóstico de conocimientos de matemática y física de todos los estudiantes de primer ingreso en el año 1996. Los datos están contenidos en el archivo de Excel  "Nuevos2" que puede ser descargado del siguiente enlace:
En éste ejemplo, la variable de interés es la nota total obtenida (en la escala de 0 a 100, donde 100 es la máxima nota posible). El archivo puede ubicarse en cualquier parte, pero lo más fácil es en el directorio raíz (c:\)

1.     Importar los datos a SAS
En la ventana EDITOR de SAS se ingresa:
Proc import datafile=”c:\nuevos2.xls out=nuevos2 dbms=xls replace; getnames=yes; run;

Datafile define la ubicación del archivo a importar
Out define el nombre del archivo de trabajo de SAS (puede ser cualquier nombre)
Dbms define el tipo de archivo a importar, en éste caso es xls (Excel)
Replace indica que se debe remplazar cualquier archivo con el mismo nombre
Getnames indica que se deben leer los datos de la primera fila como los nombres de las variables

2.     Especificar el diagrama QQ-Plot:
title "Grafica QQ para chequeo de normalidad";
proc univariate data=nuevos2;
      qqplot total;
   run;

 Todas las instrucciones se escriben en la ventana EDITOR y luego en la pestaña RUN se escoge la opción SUBMIT.
El resultado obtenido es el siguiente:



 
Como la mayoría de datos están muy cerca de formar una línea recta,  entonces  se concluye que sí hay distribución normal en los datos

No hay comentarios:

Publicar un comentario