10.10. Convergência fraca do método de Euler-Maruyama

Para a convergência fraca, buscamos mostrar que

maxj=1,,nE[Φ(Xtj)]E[Φ(Xjn)]0, \max_{j=1, \ldots, n} |\mathbb{E}[\Phi(X_{t_j})] - \mathbb{E}[\Phi(X_j^n)]| \rightarrow 0,

quando n,n\rightarrow \infty, para uma classe apropriada de funções Φ.\Phi. Mais ainda, buscamos estimar a ordem de convergência. Faremos isso no caso do método de Euler-Maruyama, mostrando a convergência de ordem 1, sob hipóteses adequadas nos termos da equação.

Contexto

Para simplificar, consideramos uma equação estocástica autônoma, ou seja,

dXt=f(Xt) dt+g(Xt) dWt, \mathrm{d}X_t = f(X_t)\;\mathrm{d}t + g(X_t)\;\mathrm{d}W_t,

com condição inicial determinística

X0=x0. X_0 = x_0.

Convergência forte implica em convergência fraca

Suponha que tenhamos a convergência forte, em média quadrática, de ordem p,p, de alguma aproximação {Xjn}j\{X_j^n\}_j da solução {Xt}t.\{X_t\}_t. Nesse caso,

maxj=0,,nE[XtjXjn2]C2Δt2p, \max_{j=0, \ldots, n} \mathbb{E}[|X_{t_j} - X_j^n|^2] \leq C^2\Delta t^{2p},

para C,p0C, p \geq 0 apropriados. Suponha ainda que Φ\Phi (ou uma classe de tais funções) satisfaça

Φ(x)Φ(y)L(1+xk+yk)xy, |\Phi(x) - \Phi(y)| \leq L(1 + |x|^k + |y|^k)|x - y|,

para certos L,k0.L, k\geq 0. Nesse caso, podemos estimar o erro fraco da seguinte forma.

E[Φ(Xtj)]E[Φ(Xjn)]E[Φ(Xtj)Φ(Xjn)]LE[(1+Xtjk+Xjnk)XtjXjn]LE[(1+Xtjk+Xjnk)2]1/2E[XtjXjn2]1/2 \begin{align*} \left|\mathbb{E}[\Phi(X_{t_j})] - \mathbb{E}[\Phi(X_j^n)] \right| & \leq \mathbb{E}\left[|\Phi(X_{t_j}) -\Phi(X_j^n)|\right] \\ & \leq L\mathbb{E}\left[ (1 + |X_{t_j}|^k + |X_j^n|^k)|X_{t_j} - X_j^n|\right] \\ & \leq L\mathbb{E}\left[ (1 + |X_{t_j}|^k + |X_j^n|^k)^2\right]^{1/2}\mathbb{E}\left[|X_{t_j} - X_j^n|^2\right]^{1/2} \end{align*}

Supondo que os momentos de ordem kk da solução e da aproximação sejam limitados, obtemos um K>0K>0 tal que

E[Φ(Xtj)]E[Φ(Xjn)]LKE[XtjXjn2]1/2LKCΔtp, \left|\mathbb{E}[\Phi(X_{t_j})] - \mathbb{E}[\Phi(X_j^n)] \right| \leq LK\mathbb{E}\left[|X_{t_j} - X_j^n|^2\right]^{1/2} \leq LKC \Delta t^p,

mostrando a convergência fraca também de ordem p.p.

No entanto, é possível estimar a ordem fraca de maneira diferente e, em muitos casos, conseguir a convergência fraca com uma ordem de convergência melhor ou mesmo obter convergência fraca sem que haja convergência forte.

Fórmula de Feynman-Kac

Em muitos casos práticos, conhecemos o valor atual Xτ=ξX_\tau = \xi de um de um processo estocástico e queremos estimar o valor esperado E[XT;Xτ=ξ]\mathbb{E}[X_T; X_\tau = \xi] em um tempo futuro T>τ,T > \tau, ou, mais geralmente, E[Φ(XT);Xτ=ξ],\mathbb{E}[\Phi(X_T); X_\tau = \xi], para algum momento Φ.\Phi. Lembremos que isso pode ser feito através da fórmula de Feynman-Kac.

Considerando a equação diferencial estocástica

dXt=f(Xt) dt+g(Xt) dWt, \mathrm{d}X_t = f(X_t)\;\mathrm{d}t + g(X_t)\;\mathrm{d}W_t,

com condição inicial

Xτ=ξ X_\tau = \xi

dada em um instante τR,\tau\in\mathbb{R}, podemos encontrar o momento

E[Φ(XT);Xτ=ξ] \mathbb{E}[\Phi(X_T); X_\tau = \xi]

em um instante futuro T>τ,T > \tau, para alguma Φ\Phi dada, resolvendo a EDP

ut(t,x)+ux(t,x)f(x)=12uxx(t,x)g(x)2, u_t(t, x) + u_x(t, x)f(x) = - \frac{1}{2}u_{xx}(t, x)g(x)^2,

no intervalo τtT,\tau \leq t \leq T, em xR,x\in \mathbb{R}, dada a condição final

u(T,x)=Φ(x), u(T, x) = \Phi(x),

em xR,x\in\mathbb{R}, e encontrando

E[Φ(XT);Xτ=ξ]=u(τ,ξ). \mathbb{E}[\Phi(X_T); X_\tau = \xi] = u(\tau, \xi).

Essa é a fórmula de Feynman-Kac.

Erro fraco

O que a fórmula de Feynman-Kac tem a ver com o erro fraco? No erro fraco, queremos estimar

maxj=1,,nE[Φ(Xtj)]E[Φ(Xjn)]. \max_{j=1, \ldots, n} |\mathbb{E}[\Phi(X_{t_j})] - \mathbb{E}[\Phi(X_j^n)]|.

Para simplificar, podemos olhar para o erro fraco só no instante final, j=n,j = n, em que tj=tn=Tt_j = t_n = T e o erro se torna

E[Φ(XT)]E[Φ(Xnn)]. |\mathbb{E}[\Phi(X_T)] - \mathbb{E}[\Phi(X_n^n)]|.

O primeiro termo pode ser visto através da fórmula de Feynman-Kac. Para o segundo, a ideia é aplicar a fórmula de Itô à seguinte interpolação da aproximação de Euler-Maruyama:

X^tn=X0+0tf(Xτn(s)n) ds+0tg(Xτn(s)n) dWs,t0, {\hat X}_t^n = X_0 + \int_0^t f(X_{\tau^n(s)}^n) \;\mathrm{d}s + \int_0^t g(X_{\tau^n(s)}^n)\;\mathrm{d}W_s, \quad t \geq 0,

onde τn\tau^n é a função de malha

τn(s)=max{tjs,j=0,,n}, \tau^n(s) = \max\{t_j \leq s, j = 0, \ldots, n\},

definida para s0.s\geq 0. Para facilitar a notação, vamos considerar, também, a interpolação constante por partes

Xˉtn=Xτn(t)n,t0. {\bar X}_t^n = X_{\tau^n(t)}^n, \quad t \geq 0.

Assim, podemos escrever

X^tn=X0+0tf(Xˉsn) ds+0tg(Xˉsn) dWs. {\hat X}_t^n = X_0 + \int_0^t f({\bar X}_s^n) \;\mathrm{d}s + \int_0^t g({\bar X}_s^n)\;\mathrm{d}W_s.

Pela fórmula de Itô,

u(T,X^Tn)=u(0,X^0n)+0T(ut(t,X^tn)+ux(t,X^tn)f(Xˉtn)+12uxx(t,X^tn)g(Xˉtn)2) dt+0Tux(t,X^tn)g(Xˉtn) dWt. \begin{align*} u(T, {\hat X}_T^n) & = u(0, {\hat X}_0^n) + \int_0^T \left(u_t(t, {\hat X}_t^n) + u_x(t, {\hat X}_t^n)f({\bar X}_t^n) + \frac{1}{2}u_{xx}(t, {\hat X}_t^n)g({\bar X}_t^n)^2\right)\;\mathrm{d}t \\ & \qquad + \int_0^T u_x(t, {\hat X}_t^n)g({\bar X}_t^n)\;\mathrm{d}W_t. \end{align*}

De acordo com a EDP,

ut(t,X^tn)=ux(t,X^tn)f(X^tn)12uxx(t,X^tn)g(X^tn)2. u_t(t, {\hat X}_t^n) = - u_x(t, {\hat X}_t^n)f({\hat X}_t^n) - \frac{1}{2}u_{xx}(t, {\hat X}_t^n)g({\hat X}_t^n)^2.

Substituindo o primeiro termo do integrando por essa expressão do lado direito, obtemos

u(T,X^Tn)=u(0,X^0n)+0T(ux(t,X^tn)f(Xˉtn)ux(t,X^tn)f(X^tn)) dt+0T(12uxx(t,X^tn)g(Xˉtn)212uxx(t,X^tn)g(X^tn)2) dt+0Tux(t,X^tn)g(Xˉtn) dWt. \begin{align*} u(T, {\hat X}_T^n) & = u(0, {\hat X}_0^n) + \int_0^T \left(u_x(t, {\hat X}_t^n)f({\bar X}_t^n) - u_x(t, {\hat X}_t^n)f({\hat X}_t^n)\right)\;\mathrm{d}t \\ & \qquad + \int_0^T \left(\frac{1}{2}u_{xx}(t, {\hat X}_t^n)g({\bar X}_t^n)^2 - \frac{1}{2}u_{xx}(t, {\hat X}_t^n)g({\hat X}_t^n)^2\right)\;\mathrm{d}t \\ & \qquad + \int_0^T u_x(t, {\hat X}_t^n)g({\bar X}_t^n)\;\mathrm{d}W_t. \end{align*}

Tomando a valor esperado,

E[u(T,X^Tn)]=E[u(0,X^0n)]+0TE[ux(t,X^tn)f(Xˉtn)ux(t,X^tn)f(X^tn)] dt+120TE[uxx(t,X^tn)g(Xˉtn)2uxx(t,X^tn)g(X^tn)2] dt \begin{align*} \mathbb{E}[u(T, {\hat X}_T^n)] & = \mathbb{E}[u(0, {\hat X}_0^n)] + \int_0^T \mathbb{E}\left[u_x(t, {\hat X}_t^n)f({\bar X}_t^n) - u_x(t, {\hat X}_t^n)f({\hat X}_t^n)\right]\;\mathrm{d}t \\ & \qquad + \frac{1}{2}\int_0^T \mathbb{E}\left[u_{xx}(t, {\hat X}_t^n)g({\bar X}_t^n)^2 - u_{xx}(t, {\hat X}_t^n)g({\hat X}_t^n)^2\right]\;\mathrm{d}t \end{align*}

Por construção,

u(T,X^Tn)=Φ(X^Tn). u(T, {\hat X}_T^n) = \Phi({\hat X}_T^n).

Além disso, pela fórmula de Feynman-Kac, como a condição inicial é em τ=0,\tau = 0, temos

u(0,X0)=E[Φ(XT)]. u(0, X_0) = \mathbb{E}[\Phi(X_T)].

Assim,

E[Φ(X^Tm)]E[Φ(XT)]=0TE[ux(t,X^tn)(f(Xˉtn)f(X^tn))] dt+120TE[uxx(t,X^tn)(g(Xˉtn)2g(X^tn)2)] dt. \begin{align*} \mathbb{E}[\Phi({\hat X}_T^m)] - \mathbb{E}[\Phi(X_T)] & = \int_0^T \mathbb{E}\left[u_x(t, {\hat X}_t^n)(f({\bar X}_t^n) - f({\hat X}_t^n))\right]\;\mathrm{d}t \\ & \qquad + \frac{1}{2}\int_0^T \mathbb{E}\left[u_{xx}(t, {\hat X}_t^n)(g({\bar X}_t^n)^2 - g({\hat X}_t^n)^2)\right]\;\mathrm{d}t. \end{align*}

Agora precisamos estimar os erros do lado direito.

A estimativa aparentemente mais natural é usar, novamente, a hipótese de continuidade Lipschitz global de ff e gg e estimar esses termos em função de E[X^tnXˉtn2].\mathbb{E}[|{\hat X}_t^n - {\bar X}_t^n|^2]. Mas, novamente, isso nos levará a mesma ordem da convergência forte, que no caso de Euler-Maruyama é 1/2. Queremos uma estimativa mais esperta, para obter uma estimativa mais precisa da ordem.

Isso é obtido aplicando-se novamente a fórmula de Itô, nesse caso aos termos

f(X^tn)f(Xˉtn),g(X^tn)2g(Xˉtn)2. f({\hat X}_t^n) - f({\bar X}_t^n), \qquad g({\hat X}_t^n)^2 - g({\bar X}_t^n)^2.

Em cada subintervalo [tj1,tj],[t_{j-1}, t_j], temos Xˉtn=Xˉtj1n=Xj1n=X^τn(t)n{\bar X}_t^n = {\bar X}_{t_{j-1}}^n = X_{j-1}^n = {\hat X}_{\tau^n(t)}^n constante, de modo que podemos olhar para

f(X^tn)f(X^τn(t)n),g(X^tn)2g(X^τn(t)n)2. f({\hat X}_t^n) - f({\hat X}_{\tau^n(t)}^n), \qquad g({\hat X}_t^n)^2 - g({\hat X}_{\tau^n(t)}^n)^2.

Aplicando a fórmula de Itô a f(X^tn)f({\hat X}_t^n) e a g(X^tn)2g({\hat X}_t^n)^2 de τn(t)\tau^n(t) a t,t, obtemos

f(X^tn)f(X^τn(t)n)=τn(t)t(f(X^sn)f(X^sn)+12f(X^sn)g(X^sn)2) ds+τn(t)tf(X^sn)g(X^sn) dWs \begin{align*} f({\hat X}_t^n) - f({\hat X}_{\tau^n(t)}^n) & = \int_{\tau^n(t)}^t \left( f'({\hat X}_s^n)f({\hat X}_s^n) + \frac{1}{2}f''({\hat X}_s^n)g({\hat X}_s^n)^2 \right)\;\mathrm{d}s \\ & \qquad \qquad + \int_{\tau^n(t)}^t f'({\hat X}_s^n)g({\hat X}_s^n) \;\mathrm{d}W_s \end{align*}

e

g(X^tn)2g(X^τn(t)n)2=τn(t)t(2g(X^sn)g(X^sn)f(X^sn)+g(X^sn)2g(X^sn)2+g(X^sn)g(X^sn)3) ds+τn(t)t2g(X^sn)g(X^sn)2 dWs. \begin{align*} g({\hat X}_t^n)^2 - g({\hat X}_{\tau^n(t)}^n)^2 & = \int_{\tau^n(t)}^t \left( 2g'({\hat X}_s^n)g({\hat X}_s^n)f({\hat X}_s^n) + g'({\hat X}_s^n)^2g({\hat X}_s^n)^2 + g''({\hat X}_s^n)g({\hat X}_s^n)^3 \right)\;\mathrm{d}s \\ & \qquad \qquad + \int_{\tau^n(t)}^t 2g'({\hat X}_s^n)g({\hat X}_s^n)^2 \;\mathrm{d}W_s. \end{align*}

Substituindo isso na fórmula acima, a esperança da integral estocástica se anula e sobra

E[Φ(X^Tm)]E[Φ(XT)]=0Tτn(t)tE[ux(t,X^tn)As] ds dt+120Tτn(t)tE[uxx(t,X^tn)Bs] ds dt, \begin{align*} \mathbb{E}[\Phi({\hat X}_T^m)] - \mathbb{E}[\Phi(X_T)] & = \int_0^T \int_{\tau^n(t)}^t \mathbb{E}\left[u_x(t, {\hat X}_t^n)A_s\right]\;\mathrm{d}s\;\mathrm{d}t \\ & \qquad + \frac{1}{2}\int_0^T \int_{\tau^n(t)}^t \mathbb{E}\left[u_{xx}(t, {\hat X}_t^n)B_s\right]\;\mathrm{d}s\;\mathrm{d}t, \end{align*}

para

As=f(X^sn)f(X^sn)+12f(X^sn)g(X^sn)2,Bs=2g(X^sn)g(X^sn)f(X^sn)+g(X^sn)2g(X^sn)2+g(X^sn)g(X^sn)3. A_s = f'({\hat X}_s^n)f({\hat X}_s^n) + \frac{1}{2}f''({\hat X}_s^n)g({\hat X}_s^n)^2, \quad B_s = 2g'({\hat X}_s^n)g({\hat X}_s^n)f({\hat X}_s^n) + g'({\hat X}_s^n)^2g({\hat X}_s^n)^2 + g''({\hat X}_s^n)g({\hat X}_s^n)^3.

Assumindo que podemos limitar

E[ux(t,X^tn)As]C1 \left|\mathbb{E}\left[u_x(t, {\hat X}_t^n)A_s\right]\right| \leq C_1

e

E[uxx(t,X^tn)Bs]C2, \left|\mathbb{E}\left[u_{xx}(t, {\hat X}_t^n)B_s\right]\right| \leq C_2,

uniformemente em tt e s,s, obtemos

E[Φ(X^Tm)]E[Φ(XT)]0Tτn(t)t(C1+C2) ds dt(C1+C2)TΔt, \left|\mathbb{E}[\Phi({\hat X}_T^m)] - \mathbb{E}[\Phi(X_T)]\right| \leq \int_0^T \int_{\tau^n(t)}^t (C_1 + C_2)\;\mathrm{d}s\;\mathrm{d}t \leq (C_1 + C_2)T\Delta t,

nos dando a convergência frace de ordem 1.1.

Outra estimativa

Uma outra maneira, feita em Higham & Kloeden (2021), é aplicar a fórmula de Itô a

ux(t,X^tn)(f(X^tn)f(Xˉtn)),uxx(t,X^tn)(g(X^tn)2g(Xˉtn)2). u_x(t, {\hat X}_t^n)(f({\hat X}_t^n) - f({\bar X}_t^n)), \qquad u_{xx}(t, {\hat X}_t^n)(g({\hat X}_t^n)^2 - g({\bar X}_t^n)^2).

Em cada subintervalo [tj1,tj],[t_{j-1}, t_j], temos Xˉtn=Xˉtj1n=Xj1n{\bar X}_t^n = {\bar X}_{t_{j-1}}^n = X_{j-1}^n constante, de modo que podemos olhar para

ej1(t,x)=ux(t,x)(f(x)f(Xj1n)) e_{j-1}(t, x) = u_x(t, x)(f(x) - f(X_{j-1}^n))

e analogamente para o termo envolvendo g.g. Observe que

ej1(tj1,X^tj1n)=ux(tj1,X^tj1n)(f(X^tj1n)f(Xˉtj1n))=0, e_{j-1}(t_{j-1}, {\hat X}_{t_{j-1}}^n) = u_x(t_{j-1}, {\hat X}_{t_{j-1}}^n)(f({\hat X}_{t_{j-1}}^n) - f({\bar X}_{t_{j-1}}^n)) = 0,

já que X^tj1n=Xˉtj1n=Xj1n{\hat X}_{t_{j-1}}^n = {\bar X}_{t_{j-1}}^n = X_{j-1}^n coincidem. Assim, pela fórmula de Itô,

ej1(t,X^tn)=0tL0(s)ej1(s,X^sn) ds+0tL1(s)ej1(s,X^sn) dWs, e_{j-1}(t, {\hat X}_t^n) = \int_0^t L_0(s) e_{j-1}(s, {\hat X}_s^n) \;\mathrm{d}s + \int_0^t L_1(s) e_{j-1}(s, {\hat X}_s^n)\;\mathrm{d}W_s,

onde L0(t)L_0(t) e L1(t)L_1(t) são operadores diferenciais definidos por

L0(t)=t+f(X^tn)x+12g(X^tn)2xx,L1(t)=g(X^tn)2x. L_0(t) = \partial_t + f({\hat X}_t^n)\partial_x + \frac{1}{2}g({\hat X}_t^n)^2 \partial_{xx}, \qquad L_1(t) = g({\hat X}_t^n)^2\partial_x.

Ao tomarmos o valor esperado, a integral de Itô, que é o termo problemático de ordem Δt1/2,\Delta t^{1/2}, desaparece e ficamos apenas com

E[ej1(t,X^tn)]=tj1tE[L0(s)ej1(s,X^sn)] ds. \mathbb{E}[e_{j-1}(t, {\hat X}_t^n)] = \int_{t_{j-1}}^t \mathbb{E}\left[ L_0(s) e_{j-1}(s, {\hat X}_s^n)\right] \;\mathrm{d}s.

Assumindo-se que o integrando seja limitado no intervalo [0,T][0, T] por uma constante KΦ,T,K_{\Phi, T}, obtemos a estimativa de ordem 1

E[ej1(t,X^tn)]KΦ,TΔt. \left| \mathbb{E}[e_{j-1}(t, {\hat X}_t^n)] \right| \leq K_{\Phi, T} \Delta t.

Idem para o termo em g,g, para o qual assumimos uma limitação com a mesma constante, para simplificar a notação. Isso nos dá, após a integração entre 00 e t,t, que

E[Φ(X^Tn)]E[Φ(XT)]2KΦ,TΔt. \left|\mathbb{E}[\Phi({\hat X}_T^n)] - \mathbb{E}[\Phi(X_T)]\right| \leq 2K_{\Phi, T} \Delta t.

Isso nos dá a convergência fraca de ordem 1, do método de Euler-Maruyama.

Condições

As limitações uniformes exigidas acima passam por (i) mostrarmos que as normas LpL^p da solução da equação parabólica são controladas pela norma LpL^p da "condição final" Φ\Phi; (ii) por assumirmos que Φ\Phi tem um crescimento polinomial (apropriado para qualquer momento que queiramos estimar); (iii) por mostrarmos que, sob a hipótese de continuidade Lipschitz global de ff e g,g, os momentos tanto da solução da equação estocástica quando das aproximações numéricas são controlados pelo momento da condição inicial X0X_0; e, por fim, (iv) por assumirmos que os momentos da condição inicial são finitos. Não entraremos em detalhes nesses itens.

Last modified: June 01, 2026. Built with Franklin.jl, using the Book Template.