Ing. Luis Manfredo Reyes
Cuando se analiza un conjunto de datos, usualmente se asume que los datos tienen una distribución normal. Tomando en cuenta que casi toda la estadística inferencial está basada en ésta condición, es importante realizar la comprobación respectiva, si los datos se adaptan a alguna distribución teórica. Hay técnicas analíticas que permiten la comprobación (Kolmogorov, Chi Cuadrado, Shapiro), pero también hay métodos gráficos que lo hacen.
En ésta ocasión se muestra como comprobar gráficamente si un conjunto de datos se aproxima a una distribución teórica (normal, binomial, chi cuadrado, t, exponencial), usando el paquete Infostat.
Infostat es un paquete estadístico producido en la Universidad de Córdoba, Argentina, que tiene la ventaja de estar escrito en español, con versión comercial y libre. Se puede obtener en: www.infostat.com.ar
Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.
DATOS DE EJEMPLO:
En la Facultad de Ciencias Químicas y Farmacia se realizó un diagnóstico de conocimientos de matemática y física de todos los estudiantes de primer ingreso en el año 1996. Los datos están contenidos en el archivo de Excel "Nuevos2" que puede ser descargado del siguiente enlace:
En éste ejemplo, la variable de interés es la nota total obtenida (en la escala de 0 a 100, donde 100 es la máxima nota posible)
1. Importar los datos a Infostat:
Ingresar a Archivo-->Abrir, luego en la ventana que aparece definir el tipo de archivo como Excel, colocar la ruta donde fue descargado y el nombre:
El Archivo importado es el siguiente:
2. Solicitar el gráfico Q-Q (Quantile-Quantile)
Ingresar a Gráficos--> Q Q Plot
Se debe definir la variable que se quiere analizar y luego continuar
a continuación se selecciona la distribución teórica deseada: (en éste ejemplo Normal)
Si se desea la recta de comparación, se marca la casilla Mostrar recta
y al dar click en Aceptar, aparece lo siguiente:
INTERPRETACIÓN: Debido a que la mayoría de los datos están muy cerca de la recta teórica, se puede decir que sí siguen una distribución normal.
La gráfica se puede editar para cambiar títulos, colores de línea y escalas
Con los mismos datos se pueden probar otras distribuciones, por ejemplo: exponencial
En éste caso la conclusión es que los datos No siguen la distribución exponencial.
No hay comentarios:
Publicar un comentario