jueves, 18 de abril de 2013

Métodos de Integración de la Distribución Normal de Probabilidades


UNIVERSIDAD DE SAN CARLOS
FACULTAD DE CIENCIAS QUIMICAS Y FARMACIA
CURSO CORTO:

MÉTODOS PARA INTEGRAR LA DISTRIBUCION NORMAL DE PROBABILIDADES




Ing. Luis Manfredo Reyes Chàvez
Guatemala, Julio de 2008


UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE CIENCIAS QUIMICAS Y FARMACIA
AREA FISICO-MATEMATICA

MÉTODOS PARA INTEGRAR LA FUNCIÒN DE PROBABILIDAD DE  LA DISTRIBUCION NORMAL
Luis Manfredo Reyes Chávez
Profesor Titular

1.    Introducción:
La distribución normal de probabilidades es quizá la más importante de las distribuciones de probabilidad de variables contínuas. Debido a la naturaleza de su función de probabilidades, el cálculo de la probabilidad entre dos valores requiere integrar entre dos límites, lo cual no es posible realizar directamente, debido a que la funciòn no tiene antiderivada.

Aunque para obtener los valores de probabilidad  se han utilizado por mucho tiempo las “tablas de áreas bajo la curva normal” , éstas tienen el inconveniente de introducir errores por aproximación o redondeo, ya que se trabaja solamente con dos decimales.


En este documento se realiza una revisión de algunos métodos que permiten la integración de la función y así poder obtener valores de probabilidad más exactos.

2.    Origen histórico
El primero en estudiar la naturaleza y propiedades de ésta distribución fue Abraham de Moivre, quien presentó en 1733 el primer documento sobre el tema. Posteriormente otros le dedicaron atención, tales como Pierre Simon LaPlace (1812) y  Karl Gauss (1794)  y Legendre (1805). Debido a que Gauss fue un matemático más conocido y famoso  que los demás, se le bautizó como “Distribución Gaussiana”.

El término “curva de campana”es debido a Jouffret, en 1872, mientras que “Distribución Normal fue aplicado primeramente aunque por separado por Charles Pierce, Francis Galton y Wilhelm Lexis,

3.    Propiedades de la distribución normal
3.1 Si x es una variable aleatoria contínua, definida en el dominio (-∞,+∞), con los parámetros: media aritmética µ y varianza σ2, entonces la función de probabilidad de x, es:

3.2 La gráfica de la distribución tiene forma de campana. Es por esa razón que rápidamente fue llamada “campana de Gauss”


Gráfica 1: Forma de la gráfica de cuatro distribuciones normales con distintos parámetros.
Fuente: Wikipedia

3.3  La gráfica es simétrica respecto a la media, que ocupa el valor central
3.4  Debido a la forma de la distribución, en un mismo punto coinciden: la media aritmética, la mediana y la moda en un mismo punto.
3.5  Los puntos de inflexión de la gráfica ocurren a una desviación estándar de distancia de la media.
3.6  La función acumulada de x, corresponde al área bajo la gráfica, entre dos valores a y b y se determina mediante la siguiente integral:
Esta integral no puede resolverse por medios convencionales, debido a que no hay teoremas ni simplificaciones que se puedan aplicar
Precisamente aquí es donde nace la necesidad de métodos alternativos de integración para obtener el àrea respectiva

4.    DISTRIBUCION NORMAL ESTANDAR
En la realidad existe una infinita cantidad de gráficas, pues cada una depende de la media y la desviación estándar. Esto podría representar una dificultad para el cálculo de las áreas. Para resolver éste inconveniente fue desarrollada una forma estadarizada de la distribución, llamada “Distribución Normal Estándar”. 
Este distribución tiene media cero y varianza 1.


No existe forma de encontrar la antiderivada de la funciòn, pero afortunadamente hay varios mètodos de càlculo que se discutiràn a contunuaciòn


5. METODOS ALTERNOS DE INTEGRACION:

5.1 USO DE SERIES DE TAYLOR
La función de probabilidad de la distribución normal puede ser sustituida por


Este mètodo tiene la ventaja de ser relativamente fàcil, pero las desventajas son: que sòlo permite integrar de cero a Z, y que se pueden necesitar muchos tèrminos para lograr suficiente precisiòn.

Ejemplo: Càlcule el àrea entre Z=0 y Z=1.5, CON 10 TÈRMINOS

TERMINO
VALOR
SUMA
AREA

1
1.5
1.5
0.59841342
2
-0.5625
0.9375
0.37400839
3
0.18984375
1.12734375
0.44974509
4
-0.067801339
1.05954241
0.42269627
5
0.022247314
1.08178973
0.43157166
6
-0.006552845
1.07523688
0.42895745
7
0.001732724
1.0769696
0.42964871
8
-0.000413732
1.07655587
0.42948365
9
8.98384E-05
1.07664571
0.42951949
10
-1.78626E-05
1.07662785
0.42951237

Comparativamente, el àrea obtenida de las tablas es: 0.4332



5.2 USO DE SERIES ASINTOTICAS
Este mètodo es útil cuando se quiere evaluar la cola derecha de la funciòn, es decir la integral entre Z y el infinito.
La serie equivalente es la siguiente:

 

  Ejemplo: Encuentre el area entre Z=2.25 y el infinito con 20 tèrminos
 
TERMINO
1/RAIZ(2PI)
EXP(-(Z^2)/2)
EXPANSION
AREA
1
0.39894228
0.07955951
0.44444444
0.01410651
2
0.39894228
0.07955951
0.35665295
0.01132004
3
0.39894228
0.07955951
0.40867754
0.01297128
4
0.39894228
0.07955951
0.35729523
0.01134043
5
0.39894228
0.07955951
0.42834237
0.01359544
6
0.39894228
0.07955951
0.30203634
0.00958653
7
0.39894228
0.07955951
0.57647908
0.01829725
8
0.39894228
0.07955951
-0.12826279
-0.00407102
9
0.39894228
0.07955951
1.95986127
0.06220531
10
0.39894228
0.07955951
-5.05211087
-0.16035224
 
Si se compara los resultados con el valor que da la tabla:  0.01222447, se puede notar que el método es divergente en algún momento, y en este ejemplo el valor es correcto hasta el quinto término

5.3 USO DE LA FUNCION GAMMA
Otra forma de evaluar la integral es utilizar la funciòn gamma. Se aplica en los casos en que el rango està entre Z1 y Z2, pero Z2=-Z1, es decir la misma distancia a la izquierda y a la derecha de la media
 
Inicialmente, se debe recordar lo siguiente:
La funciòn gamma  se define por la siguiente integral:
 

Aunque la función es relativamente fácil de evaluar usando integración por partes, también existen tablas.
Ejemplo: Calcule el área para una región entre Z=-2.25 y  Z=2.25 con 11 tèrminos
Z=
2.25




U=
1.590990258




e^(-U^2)=
0.079559509




Gamma(1/2)=
1.772453851




1/raiz(pi)=
0.564189584
















TERMINO
Gamma(3/2+n)
U^2n
Producto
Suma
Area
0
0.886227
1.000000
2.000000
2.000000
0.142828
1
1.329340
2.531250
3.375000
5.375000
0.383851
2
3.323351
6.407227
3.417188
8.792188
0.627887
3
11.631728
16.218292
2.471359
11.263546
0.804377
4
52.342778
41.052552
1.390139
12.653686
0.903653
5
287.885278
103.914273
0.639780
13.293466
0.949342
6
1871.254305
263.033003
0.249145
13.542611
0.967135
7
14034.407291
665.802289
0.084086
13.626697
0.973140
8
119292.461970
1685.312044
0.025040
13.651738
0.974928
9
1133278.388710
4265.946111
0.006672
13.658410
0.975405
10
11899423.081422
10798.176095
0.001608
13.660018
0.975519
 
Comparativamente, el valor producido por la tabla es: 0.9876






5.4 METODO DE LA FUNCION DE ERROR
La funciòn de error se define como:


El resultado es el àrea derecha (entre menos infinito y Z)

Ejemplo: obtenga el valor del àrea para una Z=1.75, con 11 tèrminos

2/raiz(pi)
1.128379167





Z=
1.75












n
(-1)^1
Z^(2n+1)
n!
2n+1
resultado
area
0
1
1.75
1
1
1.97466354
1.97466354
1
-1
5.35938
1
3
-2.01580237
-0.04113882
2
1
16.41309
2
5
1.85201842
1.8108796
3
-1
50.26508
6
7
-1.3504301
0.4604495
4
1
153.93679
24
9
0.80416237
1.26461187
5
-1
471.43143
120
11
-0.40299501
0.86161686
6
1
1443.75876
720
13
0.17404993
1.03566679
7
-1
4421.51121
5040
15
-0.06599393
0.96967286
8
1
13540.87808
40320
17
0.02229115
0.99196401
9
-1
41468.93911
362880
19
-0.00678674
0.98517727
10
1
126998.62602
3628800
21
0.00188049
0.98705776
Comparativamente, el resultado de la tabla es 0.9599


5.5 MÈTODO DE SIMPSON
El mètodo de Simpson es un mètodo “general” para realizar integraciones, y por lo tanto puede aplicarse en el caso de la integración de la Distribución Normal, tanto estàndar como no estándar. Se llama asì en honor al matemàtico Thomas Simpson (1710-1761)

La metodología de Simpson es la siguiente:
a) Calcular un valor llamado “h”=(b-a)/n
    Donde b es el lìmite superior de integración, a es el lìmite inferior de integración     
    y n es la cantidad de segmentos que se quiere calcular.

b) El valor aproximado del área es:




Ejemplo: Calcule el àrea entre Z=-1.2  y Z=2.5 con n=10

a
1.2




b
2.5




n
10




h
0.13




h/3











termino
xi
coeficiente
f(xi)
producto
area
0
1.200
1
0.19418605
0.00841473
0.00841473
1
1.330
4
0.16473972
0.02855488
0.03696961
2
1.460
2
0.13741654
0.01190943
0.04887905
3
1.590
4
0.11270421
0.0195354
0.06841444
4
1.720
2
0.09088698
0.00787687
0.07629131
5
1.850
4
0.07206487
0.01249124
0.08878256
6
1.980
2
0.05618314
0.00486921
0.09365176
7
2.110
4
0.04306742
0.00746502
0.10111678
8
2.240
2
0.03246027
0.00281322
0.10393001
9
2.370
4
0.02405557
0.00416963
0.10809964
10
2.500
1
0.0175283
0.00075956
0.1088592

Comparativamente, el valor de la tabla es 0.1088


5.6 METODO DE HASTINGS
Desde el punto de vista computacional, quizà el mètodo màs utilizado, tanto en computadoras como en calculadoras, es el mètodo de Hastings, desarrollado por Cecil Hastings . Este mètodo fue presentado en  1955 y el libro es un clàsico

La aproximación para la funciòn acumulada es la siguiente:

En la cual: t=1/(1+pZ),      p=0.2316419          b1=0.319381530     b2=-0.356563782
                                     B3=1.781477937    b4= -1.821255978  b5=1.330274429

El error en la aproximación es menor que 7.5 x 10-8

La principal ventaja del mètodo radica en que en lugr de usar un proceso iterativo, el resultado se calcula directamente.

Por ejemplo, calcular el àrea izquierda para una Z=1.96
Z
1.96

t
0.687749336

1/raiz(2pi)
0.39894228

e^-.5z^2
0.146489723




coeficiente

t^n
b1
0.31938153
0.21965444
b2
-0.356563782
-0.16865437
b3
1.781477937
0.57952342
b4
-1.821255978
-0.40746631
b5
1.330274429
0.20468789

suma
0.42774506

producto
0.02499783

area
0.97500217
El valor obtenido coincide casi exactamente con el valor de la tabla

CONCLUSIONES:
De los mètodos aquì discutidos el màs recomendable es el de Hastings debido a su precisiòn y su facilidad de càlculo.

El mètodo de Simpson tambièn produce resultados razonables.

El resto de mètodos requiere muchos tèrminos para lograr una exactitud adecuada.

 BIBLIOGRAFIA:
Abramowitz y Stegun, Handbook of Mathematical Functions
Irvine, Tom, Integration of the Normal Distribution Curve
Math pages, Integrating the Bell Curve: http://www.mathpages.com/home/kmath045/kmath045.htm
Zang, Jim, Mathematical Techniques of Finance
Zill, Denis, Càlculo con Geometrìa Analìtica, Editorial Iberoamericana
www. Wikipedia.org

1 comentario:

  1. Es un excelente artículo, me sacó de apuros, ya que no encontraba la forma como construir un item para la curva normal en el programa Examview

    ResponderEliminar