UNIVERSIDAD
DE SAN CARLOS
FACULTAD
DE CIENCIAS QUIMICAS Y FARMACIA
CURSO
CORTO:
MÉTODOS
PARA INTEGRAR LA DISTRIBUCION NORMAL DE PROBABILIDADES
Ing.
Luis Manfredo Reyes Chàvez
Guatemala,
Julio de 2008
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE CIENCIAS QUIMICAS Y FARMACIA
AREA FISICO-MATEMATICA
MÉTODOS PARA INTEGRAR LA FUNCIÒN DE PROBABILIDAD
DE LA DISTRIBUCION NORMAL
Luis Manfredo Reyes Chávez
Profesor Titular
1. Introducción:
La distribución normal de probabilidades es quizá la más
importante de las distribuciones de probabilidad de variables contínuas. Debido
a la naturaleza de su función de probabilidades, el cálculo de la probabilidad
entre dos valores requiere integrar entre dos límites, lo cual no es posible
realizar directamente, debido a que la funciòn no tiene antiderivada.
Aunque para obtener los valores de probabilidad se han utilizado por mucho tiempo las “tablas
de áreas bajo la curva normal” , éstas tienen el inconveniente de introducir
errores por aproximación o redondeo, ya que se trabaja solamente con dos
decimales.
En este documento se realiza una revisión de algunos
métodos que permiten la integración de la función y así poder obtener valores
de probabilidad más exactos.
2. Origen
histórico
El primero en estudiar la naturaleza y propiedades de
ésta distribución fue Abraham de Moivre, quien presentó en 1733 el primer
documento sobre el tema. Posteriormente otros le dedicaron atención, tales como
Pierre Simon LaPlace (1812) y Karl Gauss
(1794) y Legendre (1805). Debido a que
Gauss fue un matemático más conocido y famoso que los demás, se le bautizó como “Distribución
Gaussiana”.
El
término “curva de campana”es debido a Jouffret, en 1872, mientras que
“Distribución Normal fue aplicado primeramente aunque por separado por Charles
Pierce, Francis Galton y Wilhelm Lexis,
3. Propiedades
de la distribución normal
3.1 Si x es una variable aleatoria contínua, definida en
el dominio (-∞,+∞), con los parámetros: media aritmética µ y varianza σ2, entonces la función de
probabilidad de x, es:
3.2 La gráfica de la distribución tiene forma de campana.
Es por esa razón que rápidamente fue llamada “campana de Gauss”
Gráfica 1: Forma de la gráfica de cuatro distribuciones
normales con distintos parámetros.
Fuente:
Wikipedia
3.3 La
gráfica es simétrica respecto a la media, que ocupa el valor central
3.4 Debido
a la forma de la distribución, en un mismo punto coinciden: la media
aritmética, la mediana y la moda en un mismo punto.
3.5 Los
puntos de inflexión de la gráfica ocurren a una desviación estándar de
distancia de la media.
3.6 La
función acumulada de x, corresponde al área bajo la gráfica, entre dos valores
a y b y se determina mediante la siguiente integral:
Esta integral no puede resolverse por
medios convencionales, debido a que no hay teoremas ni simplificaciones que se
puedan aplicar
Precisamente aquí es donde nace la necesidad de métodos
alternativos de integración para obtener el àrea respectiva
4. DISTRIBUCION
NORMAL ESTANDAR
En
la realidad existe una infinita cantidad de gráficas, pues cada una depende de
la media y la desviación estándar. Esto podría representar una dificultad para
el cálculo de las áreas. Para resolver éste inconveniente fue desarrollada una
forma estadarizada de la distribución, llamada “Distribución Normal
Estándar”.
Este distribución tiene media cero y varianza
1.
No existe forma de encontrar la
antiderivada de la funciòn, pero afortunadamente hay varios mètodos de càlculo
que se discutiràn a contunuaciòn
5.
METODOS ALTERNOS DE INTEGRACION:
5.1
USO DE SERIES DE TAYLOR
La función de probabilidad de la distribución normal puede
ser sustituida por
Este mètodo tiene la ventaja de
ser relativamente fàcil, pero las desventajas son: que sòlo permite integrar de
cero a Z, y que se pueden necesitar muchos tèrminos para lograr suficiente
precisiòn.
Ejemplo: Càlcule el àrea entre
Z=0 y Z=1.5, CON 10 TÈRMINOS
TERMINO
|
VALOR
|
SUMA
|
AREA
|
1
|
1.5
|
1.5
|
0.59841342
|
2
|
-0.5625
|
0.9375
|
0.37400839
|
3
|
0.18984375
|
1.12734375
|
0.44974509
|
4
|
-0.067801339
|
1.05954241
|
0.42269627
|
5
|
0.022247314
|
1.08178973
|
0.43157166
|
6
|
-0.006552845
|
1.07523688
|
0.42895745
|
7
|
0.001732724
|
1.0769696
|
0.42964871
|
8
|
-0.000413732
|
1.07655587
|
0.42948365
|
9
|
8.98384E-05
|
1.07664571
|
0.42951949
|
10
|
-1.78626E-05
|
1.07662785
|
0.42951237
|
Comparativamente, el àrea
obtenida de las tablas es: 0.4332
5.2 USO DE SERIES ASINTOTICAS
Este mètodo es útil cuando se
quiere evaluar la cola derecha de la funciòn, es decir la integral entre Z y el
infinito.
La serie equivalente es la
siguiente:
Ejemplo: Encuentre el area entre Z=2.25 y el infinito con 20 tèrminos
TERMINO
|
1/RAIZ(2PI)
|
EXP(-(Z^2)/2)
|
EXPANSION
|
AREA
|
1
|
0.39894228
|
0.07955951
|
0.44444444
|
0.01410651
|
2
|
0.39894228
|
0.07955951
|
0.35665295
|
0.01132004
|
3
|
0.39894228
|
0.07955951
|
0.40867754
|
0.01297128
|
4
|
0.39894228
|
0.07955951
|
0.35729523
|
0.01134043
|
5
|
0.39894228
|
0.07955951
|
0.42834237
|
0.01359544
|
6
|
0.39894228
|
0.07955951
|
0.30203634
|
0.00958653
|
7
|
0.39894228
|
0.07955951
|
0.57647908
|
0.01829725
|
8
|
0.39894228
|
0.07955951
|
-0.12826279
|
-0.00407102
|
9
|
0.39894228
|
0.07955951
|
1.95986127
|
0.06220531
|
10
|
0.39894228
|
0.07955951
|
-5.05211087
|
-0.16035224
|
Si se compara los
resultados con el valor que da la tabla: 0.01222447, se puede notar que el método es
divergente en algún momento, y en este ejemplo el valor es correcto hasta el
quinto término
5.3 USO DE LA FUNCION GAMMA
Otra forma de evaluar la integral es utilizar la funciòn gamma. Se aplica en los casos en que el rango està entre Z1 y Z2, pero Z2=-Z1, es decir la misma distancia a la izquierda y a la derecha de la media
Inicialmente, se debe recordar lo siguiente:
La funciòn gamma se define por la siguiente integral:
Aunque la función es relativamente fácil de evaluar
usando integración por partes, también existen tablas.
Ejemplo: Calcule el área para una región entre Z=-2.25 y Z=2.25 con 11 tèrminos
Z=
|
2.25
|
||||
U=
|
1.590990258
|
||||
e^(-U^2)=
|
0.079559509
|
||||
Gamma(1/2)=
|
1.772453851
|
||||
1/raiz(pi)=
|
0.564189584
|
||||
TERMINO
|
Gamma(3/2+n)
|
U^2n
|
Producto
|
Suma
|
Area
|
0
|
0.886227
|
1.000000
|
2.000000
|
2.000000
|
0.142828
|
1
|
1.329340
|
2.531250
|
3.375000
|
5.375000
|
0.383851
|
2
|
3.323351
|
6.407227
|
3.417188
|
8.792188
|
0.627887
|
3
|
11.631728
|
16.218292
|
2.471359
|
11.263546
|
0.804377
|
4
|
52.342778
|
41.052552
|
1.390139
|
12.653686
|
0.903653
|
5
|
287.885278
|
103.914273
|
0.639780
|
13.293466
|
0.949342
|
6
|
1871.254305
|
263.033003
|
0.249145
|
13.542611
|
0.967135
|
7
|
14034.407291
|
665.802289
|
0.084086
|
13.626697
|
0.973140
|
8
|
119292.461970
|
1685.312044
|
0.025040
|
13.651738
|
0.974928
|
9
|
1133278.388710
|
4265.946111
|
0.006672
|
13.658410
|
0.975405
|
10
|
11899423.081422
|
10798.176095
|
0.001608
|
13.660018
|
0.975519
|
Comparativamente,
el valor producido por la tabla es: 0.9876
5.4 METODO DE LA FUNCION DE ERROR
La funciòn de error se define como:
El resultado es el àrea derecha (entre menos infinito y Z)
Ejemplo: obtenga el valor del àrea para una Z=1.75, con 11 tèrminos
2/raiz(pi)
|
1.128379167
|
|||||
Z=
|
1.75
|
|||||
n
|
(-1)^1
|
Z^(2n+1)
|
n!
|
2n+1
|
resultado
|
area
|
0
|
1
|
1.75
|
1
|
1
|
1.97466354
|
1.97466354
|
1
|
-1
|
5.35938
|
1
|
3
|
-2.01580237
|
-0.04113882
|
2
|
1
|
16.41309
|
2
|
5
|
1.85201842
|
1.8108796
|
3
|
-1
|
50.26508
|
6
|
7
|
-1.3504301
|
0.4604495
|
4
|
1
|
153.93679
|
24
|
9
|
0.80416237
|
1.26461187
|
5
|
-1
|
471.43143
|
120
|
11
|
-0.40299501
|
0.86161686
|
6
|
1
|
1443.75876
|
720
|
13
|
0.17404993
|
1.03566679
|
7
|
-1
|
4421.51121
|
5040
|
15
|
-0.06599393
|
0.96967286
|
8
|
1
|
13540.87808
|
40320
|
17
|
0.02229115
|
0.99196401
|
9
|
-1
|
41468.93911
|
362880
|
19
|
-0.00678674
|
0.98517727
|
10
|
1
|
126998.62602
|
3628800
|
21
|
0.00188049
|
0.98705776
|
Comparativamente, el resultado de la tabla es 0.9599
5.5 MÈTODO DE SIMPSON
El mètodo de Simpson es un mètodo “general” para realizar integraciones,
y por lo tanto puede aplicarse en el caso de la integración de la Distribución
Normal, tanto estàndar como no estándar. Se llama asì en honor al matemàtico
Thomas Simpson (1710-1761)
La metodología de Simpson es la siguiente:
a) Calcular un valor llamado “h”=(b-a)/n
Donde b es el lìmite superior
de integración, a es el lìmite inferior de integración
y n es la cantidad de
segmentos que se quiere calcular.
b) El valor aproximado del área es:
Ejemplo: Calcule el àrea entre Z=-1.2
y Z=2.5 con n=10
a
|
1.2
|
||||
b
|
2.5
|
||||
n
|
10
|
||||
h
|
0.13
|
||||
h/3
|
|||||
termino
|
xi
|
coeficiente
|
f(xi)
|
producto
|
area
|
0
|
1.200
|
1
|
0.19418605
|
0.00841473
|
0.00841473
|
1
|
1.330
|
4
|
0.16473972
|
0.02855488
|
0.03696961
|
2
|
1.460
|
2
|
0.13741654
|
0.01190943
|
0.04887905
|
3
|
1.590
|
4
|
0.11270421
|
0.0195354
|
0.06841444
|
4
|
1.720
|
2
|
0.09088698
|
0.00787687
|
0.07629131
|
5
|
1.850
|
4
|
0.07206487
|
0.01249124
|
0.08878256
|
6
|
1.980
|
2
|
0.05618314
|
0.00486921
|
0.09365176
|
7
|
2.110
|
4
|
0.04306742
|
0.00746502
|
0.10111678
|
8
|
2.240
|
2
|
0.03246027
|
0.00281322
|
0.10393001
|
9
|
2.370
|
4
|
0.02405557
|
0.00416963
|
0.10809964
|
10
|
2.500
|
1
|
0.0175283
|
0.00075956
|
0.1088592
|
Comparativamente, el valor de la tabla es 0.1088
5.6 METODO DE HASTINGS
Desde el punto de vista computacional, quizà el mètodo màs utilizado,
tanto en computadoras como en calculadoras, es el mètodo de Hastings,
desarrollado por Cecil Hastings . Este mètodo fue presentado en 1955 y el libro es un clàsico
En la cual: t=1/(1+pZ),
p=0.2316419 b1=0.319381530 b2=-0.356563782
B3=1.781477937 b4=
-1.821255978 b5=1.330274429
El error en la aproximación es menor que 7.5 x 10-8
La principal ventaja del mètodo radica en que en lugr de usar un proceso
iterativo, el resultado se calcula directamente.
Por ejemplo, calcular el àrea izquierda para una Z=1.96
Z
|
1.96
|
|
t
|
0.687749336
|
|
1/raiz(2pi)
|
0.39894228
|
|
e^-.5z^2
|
0.146489723
|
|
coeficiente
|
t^n
|
|
b1
|
0.31938153
|
0.21965444
|
b2
|
-0.356563782
|
-0.16865437
|
b3
|
1.781477937
|
0.57952342
|
b4
|
-1.821255978
|
-0.40746631
|
b5
|
1.330274429
|
0.20468789
|
suma
|
0.42774506
|
|
producto
|
0.02499783
|
|
area
|
0.97500217
|
El valor obtenido coincide casi exactamente con el valor de la tabla
CONCLUSIONES:
De los mètodos aquì discutidos el màs recomendable es el de Hastings
debido a su precisiòn y su facilidad de càlculo.
El mètodo de Simpson tambièn produce resultados razonables.
El resto de mètodos requiere muchos tèrminos para lograr una exactitud
adecuada.
BIBLIOGRAFIA:
Abramowitz y Stegun, Handbook of Mathematical
Functions
Math pages, Integrating the Bell Curve: http://www.mathpages.com/home/kmath045/kmath045.htm
Zang, Jim, Mathematical Techniques of Finance
Zill, Denis, Càlculo con Geometrìa Analìtica,
Editorial Iberoamericana
www. Wikipedia.org
Es un excelente artículo, me sacó de apuros, ya que no encontraba la forma como construir un item para la curva normal en el programa Examview
ResponderEliminar