martes, 18 de noviembre de 2014

ANÁLISIS EXPLORATORIO GRÁFICO DE DATOS CON INFOSTAT

ANÁLISIS EXPLORATORIO GRÁFICO  DE DATOS CON INFOSTAT
Ing. Luis Manfredo Reyes

En la estadística descriptiva, para describir las propiedades de una población, se recurre al cálculo de ciertos valores que se obtienen de ella (estadísticos), tales como la moda, la media, la varianza, etc.

Sin embargo, existen otras herramientas que ayudan a explicar el comportamiento de los datos, y que son poco utilizadas. Una de ellas es la gráfica de cajas (Box Plot) y la gráfica de densidad de datos. Ambas herramientas están disponibles en Infostat.


Infostat es un paquete estadístico producido en la Universidad de Córdoba, Argentina, que tiene la ventaja de estar escrito en español, con versión comercial y libre. Se puede obtener en: www.infostat.com.ar


Se asume que el lector tiene instalado el paquete y conoce el uso básico del mismo.

DATOS DE EJEMPLO:
En la Facultad de Ciencias Químicas y Farmacia se realizó un diagnóstico de conocimientos de matemática y física de todos los estudiantes de primer ingreso en el año 1996. Los datos están contenidos en el archivo de Excel  "Nuevos2" que puede ser descargado del siguiente enlace:
En éste ejemplo, la variable de interés es la nota total obtenida (en la escala de 0 a 100, donde 100 es la máxima nota posible)

1. Importar los datos a Infostat:
Ingresar a Archivo-->Abrir, luego en la ventana que aparece definir el tipo de archivo como Excel, colocar la ruta donde fue descargado y el nombre:

El Archivo importado es el siguiente:

2. Solicitar la gráfica de cajas.
Ingresar a GRÁFICOS--> GRÁFICO DE CAJAS.
En la ventana que aparece se ingresa la variable de interés (TOTAL)

Al dar click en aceptar, aparece lo siguiente:

Es posible definir escalas, título, y la información presentada en la gráfica.
En éste ejemplo: la interpretación es la siguiente:
El rectángulo amarillo central representa el 50% de los datos y está comprendido entre el primer y tercer cuartiles de los datos.

Al centro del rectángulo está la mediana. El puntito negro que aparece arriba de la mediana es la media aritmética. 

Los valores extremos son: el superior el percentil 90 (90% de los datos están por debajo)  y el inferior el percentil 10 (19% de los datos están por debajo)

La gráfica muestra que existe una gran concentración de los datos por debajo de la media aritmética y que los datos mayores que la media son pocos. 

Es posible comparar en la misma gráfica diferentes grupos. Por ejemplo se puede analizar la variabilidad de los datos entre los diferentes títulos de secundaria con los que ingresaron a la universidad .
Para ello, en la casilla de Criterios de clasificación se ingresa TITULO. La gráfica producida es la siguiente:

Aquí puede verse que el grupo más consistente (con menos variabilidad) es de los peritos, mientras que el más disperso es el de los bachilleres en computación.

Por otra parte, también los peritos tienen el menor promedio, miengras que el mayor promedio corresponde a los agrónomos.

Para solicitar el gráfico de densidad de puntos, se ingresa a GRÁFICOS--> GRÁFICO DE DENSIDAD DE PUNTOS,  y en la ventana correspondiente se escoge la variable TOTAL
la gráfica presentada es la siguiente:


Se puede notar la cantidad de puntos que se ubican en cada nota. 
Existe una concentración de notas por debajo de la media aritmética. 
Las notas altas son pocas. 


No hay comentarios:

Publicar un comentario