martes, 17 de abril de 2018


ANÁLISIS DE CONGLOMERADOS (CLUSTER) CON INFOSTAT: EL CASO DE LAS HAMBURGUESAS DE McDONALDS®

ANÁLISIS DE CONGLOMERADOS (CLUSTER) CON INFOSTAT: EL CASO DE LAS HAMBURGUESAS DE McDONALDS®
Ing. Luis Manfredo Reyes

El análisis de conglomerados (cluster), es una técnica multivariada, en la cual en base a un conjunto de características cuantitativas, se realiza una agrupación de individuos en base a las distancias entre ellos.
Al final del análisis, se obtiene un diagrama llamado DENDROGRAMA, que resume gráficamente el agrupamiento.

No es el objetivo de éste documento profundizar en la teoría del método, sino ejemplificar su análisis en Infostat.

lunes, 9 de abril de 2018

ANÁLISIS DE CONGLOMERADOS PARA DATOS MULTIVARIADOS CON R:EL CASO DE LAS HAMBURGUESAS DE MCDONALDS®


ANÁLISIS DE CONGLOMERADOSPARA DATOS MULTIVARIADOS CON R: 

EL CASO DE LAS HAMBURGUESAS DE MCDONALDS®
Ing. Luis Manfredo Reyes

Introducción:
En el análisis estadístico tradicional, se analizan una por una las variables de interés, o a lo sumo se elaboran pruebas de hipótesis para cada variable. Pero cuando se trata de más de dos variables, la situación se hace muy difícil de manejar manualmente.-
De todos los métodos que se han desarrollado, hay uno que permite agrupar los datos, mediante la medición de las distancias entre los individuos y la creación de una gráfica (Dendograma)

La técnica se denomina Análisis de Conglomerados (Cluster).

El objetivo de éste artículo no es profundizar en los detalles del análisis manual de la técnica, sino definir cómo se realiza en el paquete estadístico R.

Debido a que últimamente se ha popularizado el uso del Lenguaje R en el mundo académico, no es de extrañar que exista la posibilidad de realizar éste análisis con el mismo.

El objetivo de éste artículo no es profundizar en los detalles del análisis manual de la técnica, sino definir cómo se realiza en el paquete estadístico R.

R es actualmente el programa estadístico más utilizado en el mundo académico y de investigación, primero por su potencia de procesamiento, y en segundo lugar por ser un software libre.

R es un software libre, que puede ser descargado del siguiente sitio:

Se asume que los lectores tienen conocimientos de cómo se utiliza el programa R
Se ilustra el uso del mismo a partir de un ejemplo

Es posible determinar gráficamente, cuales son los individuos más parecidos o más distintos, mediante la aplicación de la técnica de conglomerados (cluster)

La siguiente tabla muestra el contenido nutricional de los productos más conocidos de la marca de Hamburgesas McDonalds ® (fuente: https://www.zonadiet.com/tablas/mcdonalds.htm)



NA significa información no disponible
McDonalds es marca registrada de McDonalds International

EN ESTE EJEMPLO NO SE DISCUTE LA CALIDAD NUTRICIONAL DE LOS PRODUCTOS, SINO EL GRADO DE PARECIDO O DIFERENCIACION QUE PRESENTAN, DE ACUERDO A LOS DATOS DE LA TABLA

SE APLICARÁ EN LOS EJERCICIOS EL MÉTODO JERÁRQUICO

Una práctica usual en el trabajo con R, es importar los datos de un archivo de Excel®. Sin embargo, siendo pocos datos, también es posible crear manualmente el archivo.

1) Importar el archivo a R: (EL ARCHIVO EN ESTE EJEMPLO ESTÁ EN FORMATO CSV)

Mcdonalds <- read.table("E:/CHERNOFF/MACDONALDS.csv", header=TRUE, sep=",", na.strings="NA", dec=".", strip.white=TRUE)

4) Solicitar el análisis los datos de comparación están en las columnas de la 2 a la 6 y la identificación de cada variable en la columna 1

EN ÉSTA TÉCNICA, LOS INDIVIDUOS QUE TIENEN DATOS FALTANTES SON EXCLUÍDOS

Variante 1: método en agrupamiento promedio, y distancia euclidiana
HClust.1 <- hclust(dist(model.matrix(~-1+ Colesterol+Grasas+Hidratos+Kilocalorias+Porcion+Proteinas+Sodio, Mcdonalds)) , method= "average")

plot(HClust.1, main= "Cluster Dendrogram for Solution HClust.1", xlab=
  "Observation Number in Data Set Mcdonalds", sub="Method=average; Distance=euclidian")
Los resultados producidos son:

Interpretación: 
El individuo que más se deferencia de los demás es el Big Mac. El Cuarto de libra con queso y el McRoyal forman un grupo que después se une al big Mac.
El cuarto de libra y el McPollo forman otro grupo, que luego se une a la quesoburguesa y posteriormente a la hamburguesa.

Los dos grandes grupos que se forman son: Los productos "mas pesados" en contenidos, y los "menos pesados". 

Variante 2: método de agrupamiento promedio y distancia euclidiana al cuadrado
HClust.2 <- hclust(dist(model.matrix(~-1 +
  Colesterol+Grasas+Hidratos+Kilocalorias+Porcion+Proteinas+Sodio, Mcdonalds))^2 , method= "average")

plot(HClust.2, main= "Cluster Dendrogram for Solution HClust.2", xlab=
  "Observation Number in Data Set Mcdonalds", sub="Method=average; Distance=squared-euclidian")


No hay variantes en los resultados, comparado con la variante 1

Variante 3: Método de Ward y distancia euclidiana
HClust.3 <- hclust(dist(model.matrix(~-1 +
  Colesterol+Grasas+Hidratos+Kilocalorias+Porcion+Proteinas+Sodio, Mcdonalds)) , method= "ward")

plot(HClust.3, main= "Cluster Dendrogram for Solution HClust.3", xlab=
  "Observation Number in Data Set Mcdonalds", sub="Method=ward; Distance=euclidian")


No hay variantes en los resultados, comparado con la variante 1

Variante 4: Método de Ward y distancia euclidiana al cuadrado
HClust.4 <- hclust(dist(model.matrix(~-1 +
  Colesterol+Grasas+Hidratos+Kilocalorias+Porcion+Proteinas+Sodio, Mcdonalds))^2 , method= "ward")

plot(HClust.4, main= "Cluster Dendrogram for Solution HClust.4", xlab=
  "Observation Number in Data Set Mcdonalds", sub="Method=ward; Distance=squared-euclidian")


La única variante en este caso es que las distancias a las que se agrupan son menores.
La interpretación es la misma que en la variante 1

Hay otras opciones que se pueden experimentar para observar los cambios que se producen en la gráfica.

viernes, 6 de abril de 2018

ANÁLISIS GRÁFICO DE DATOS MULTIVARIADOS CON R: CARITAS DE CHERNOFF


ANÁLISIS GRÁFICO DE DATOS MULTIVARIADOS CON R:
CARITAS DE CHERNOFF

Ing. Luis Manfredo Reyes

Introducción:
En el análisis estadístico tradicional, se grafican una por una las variables de interés, o a lo sumo se elaboran gráficas de dispersión. Pero cuando se trata de más de dos variables, la situación se hace muy difícil de manejar.

De todos los métodos que se han desarrollado, hay uno que permite comparar grupos de datos, de una forma gráfica: Las caritas de Chernoff.

viernes, 24 de noviembre de 2017

SOLUCIÓN DE SISTEMAS NO LINEALES DE ECUACIONES CON GEOGEBRA

SOLUCIÓN DE SISTEMAS NO LINEALES DE ECUACIONES CON GEOGEBRA


Ing. Luis Manfredo Reyes

He recibido una consulta donde me preguntan ¿cómo se pueden resolver sistemas no lineales de ecuaciones.


Un sistema no lineal de ecuaciones es aquel donde por lo menos una de sus ecuaciones no es de primer grado.

sábado, 29 de julio de 2017

DESCOMPOSICION EN FRACCIONES PARCIALES CON REDUCE

DESCOMPOSICION EN FRACCIONES PARCIALES CON REDUCE

Ing. Luis Manfredo Reyes

Introducción:
En la técnica de integración por descomposición en fracciones parciales, es necesario transformar la expresión original en una equivalente que sea la suma de varias fracciones, para poder aplicar algún teorema de integración.

POR SUPUESTO  REDUCE PRESENTAR LA RESPUESTA FINAL, pero usualmente en un exámen se exige el procedimiento. El programa no presenta la solución paso a paso, para no malacostumbrar al estudiante a tener todo ya hecho.

REDUCE es un software de álgebra computacional (CAS) desarrollado especialmente  para  usos en física. Comenzó a ser desarrollado desde 1960 por Anthony Hearn, desde entonces, muchos colaboradores de todo el mundo han contribuido a su desarrollo.
 Actualmente está disponible en las plataformas de UnixLinuxWindows, o Mac OS,,Android e IOS 
el software puede ser descargado sin costo del sitio: http://reduce-algebra.sourceforge.net/
La versión para android está disponible en el Play Market
En éste artículo se muestran aplicaciones del Reduce  en el tema de la descomposición de una expresión en fracciones parciales,  partiendo de ejemplos clásicos de cualquier curso de álgebra

ÁLGEBRA LINEAL CON REDUCE

ÁLGEBRA LINEAL CON REDUCE
Ing. Luis Manfredo Reyes

El Algebra lineal es una rama de la matemática en la cual se opera con entidades llamadas Matrices y Vectores.

En éste documento se discuten las principales operaciones quese pueden realizar usando el programa Mathematica


Siendo el paquete computacional REDUCE uno de los más importantes en el campo de la computación aplicada a la matemática, no es de extrañar que contenga utilidades para la resolución de aplicaciones de álgebra lineal.


En este documento se analizan los casos más importantes de operaciones con vectores y matrices, aplicando el paquete. Sin embargo, se debe tomar en cuenta que, éste software no es un sustituto del estudio ni de la resolución manual. Es solamente una herramienta de apoyo.

sábado, 15 de julio de 2017

ALGEBRA CON REDUCE

ALGEBRA CON REDUCE
Ing. Luis Manfredo Reyes

REDUCE es un software de álgebra computacional (CAS) desarrollado especialmente  para  usos en física. Comenzó a ser desarrollado desde 1960 por Anthony Hearn, desde entonces, muchos colaboradores de todo el mundo han contribuido a su desarrollo.
 Actualmente está disponible en las plataformas de UnixLinuxWindows, o Mac OS,,Android e IOS 
el software puede ser descargado sin costo del sitio: http://reduce-algebra.sourceforge.net/
La versión para android está disponible en el Play Market
En éste artículo se muestran aplicaciones del Reduce  en el tema del álgebra,  partiendo de ejemplos clásicos de cualquier curso de álgebra

martes, 11 de julio de 2017

SOFTWARE MATEMÁTICO REDUCE: OTRA OPCIÓN PARA EL ESTUDIO DE LA MATEMÁTICA

SOFTWARE MATEMÁTICO REDUCE: OTRA OPCIÓN PARA EL ESTUDIO DE LA MATEMÁTICA

Ing. Luis Manfredo Reyes

Introducción:
Partiendo de la famosa frase de Charles Babbagge: "ojalá estos cálculos me los hiciera una máquina de vapor", a lo largo de la historia siempre han existido deseos de los matemáticos de contar con máquinas capaces de resolver operaciones aritméticas y algebráicas para auxiliarse en sus labores.

En el caso de los programas matemáticos, no solamente ha existido el deseo de auxilio aritmético, sino también simbólico.

lunes, 19 de junio de 2017

CALCULO DE VALORES Y VECTORES PROPIOS CON GEOGEBRA

CALCULO DE VALORES Y VECTORES PROPIOS CON GEOGEBRA


ING. LUIS MANFREDO REYES



1.      INTRODUCCION: Los valores y vectores propios, son propiedades importantes de las matrices cuadradas de tamaño nxn y tienen aplicaciones en el cálculo y la estadística. En éste documento  se estudiará el uso de GEOGEBRA para el cálculo de valores y vectores propios, 
2.