Ing. Luis Manfredo Reyes
Cuando se analiza un conjunto de datos, usualmente se asume que los datos tienen una distribución normal. Tomando en cuenta que casi toda la estadística inferencial está basada en ésta condición, es importante realizar la comprobación respectiva, si los datos se adaptan a alguna distribución teórica. Hay técnicas analíticas que permiten la comprobación (Kolmogorov, Chi Cuadrado, Shapiro), pero también hay métodos gráficos que lo hacen.
En ésta ocasión se muestra como comprobar gráficamente si un conjunto de datos se aproxima a una distribución normal teórica, usando R
R es un paquete estadístico producido en el proyecto GNU , y se puede descargar en éste link:
http://www.r-project.org/
Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.
DATOS DE EJEMPLO:
En la Facultad de Ciencias Químicas y Farmacia se realizó un diagnóstico de conocimientos de matemática y física de todos los estudiantes de primer ingreso en el año 1996. Los datos están contenidos en el archivo de Excel "Nuevos2" que puede ser descargado del siguiente enlace:
En éste ejemplo, la variable de interés es la nota total obtenida (en la escala de 0 a 100, donde 100 es la máxima nota posible)
suponiendo que el archivo se encuentra en el directorio Documentos:
se ingresa la orden:
datos <- read.table("C:/Users/area fisicomate/Documents/Nuevos2.xls",header=TRUE)
datos
y el programa presenta los datos:
ahora se ingresan las órdenes de analizar la variable TOTAL y calcular la distribución teórica
qqnorm(datos$TOTAL)
qqline(datos$TOTAL)
el programa presenta el siguiente resultado:
Como la mayoría de datos están muy cerca de la recta teórica, se concluye que sí hay distribución normal en los datos
http://reyesestadistica.blogspot.com/2014/09/pruebas-de-normalidad-con-r.html
No hay comentarios:
Publicar un comentario