2.9. Tipos de convergências

"Whereas weak convergence measures the error of the means, strong convergence measures the mean of the errors". - Higham & Kloeden, in An Introduction to the Numerical Simulation of Stochastic Differential Equations (SIAM, 2021) página 83, Seção 8.4.

Noções de convergência para sequências de variáveis aleatórias reais

Vamos considerar, para começar, variáveis aleatórias reais XX e {Xn}nN\{X_n\}_{n\in \mathbb{N}} em um mesmo espaço de probabilidade (Ω,A,P).(\Omega, \mathcal{A}, \mathbb{P}).

Convergência quase certamente

Dizemos que XnX_nconverge fortemente, ou quase sempre, ou quase certamente, ou em quase toda parte, para XX quando o conjunto {ω; Xn(ω)X(ω)}\{\omega; \;X_n(\omega) \rightarrow X(\omega)\} tem probabilidade total, i.e.

P(XnX)=1. \mathbb{P}(X_n \rightarrow X) = 1.

Convergência em probabilidade

Dizemos que XnX_nconverge em probabilidade, ou em medida, para XX quando

ε>0, P(XnX>ε)0. \forall \varepsilon > 0, \; \mathbb{P}(|X_n - X| > \varepsilon) \rightarrow 0.

Convergência fraca ou em distribuição

Dizemos que XnX_nconverge fracamente, ou em distribuição, para XX quando

P(Xnx)P(Xx), \mathbb{P}(X_n \leq x) \rightarrow \mathbb{P}(X \leq x),

para todo xx que seja ponto de continuidade da função xP(Xx)x \mapsto \mathbb{P}(X \leq x) de distribuição acumulada de X.X.

Convergência em média

Dizemos que XnX_nconverge em média para XX quando

E(XnX)0. \mathbb{E}(|X_n - X|) \rightarrow 0.

Convergência em média quadrática

Dizemos que XnX_nconverge em média quadrática para XX quando

E(XnX2)0. \mathbb{E}(|X_n - X|^2) \rightarrow 0.

Convergência em média pp

Dado p>0,p > 0, dizemos que XnX_nconverge em média p, ou converge em momento de ordem p para XX quando

E(XnXp)0. \mathbb{E}(|X_n - X|^p) \rightarrow 0.

A convergência em média corresponde ao caso p=1p = 1 e a convergência em média quadrática corresponde a p=2.p = 2. Em Teoria da Medida, dizemos que XnX_n converge para XX em Lp(Ω).L^p(\Omega).

Para todo p1,p \geq 1, Lp(Ω)L^p(\Omega) forma uma espaço de Banach, que é um espaço normado completo, com norma XLp=(E[Xp])1/p.\|X\|_{L^p} = \left(\mathbb{E}[|X|^p]\right)^{1/p}. No caso p=2,p = 2, temos que L2(Ω)L^2(\Omega) é um espaço de Hilbert, que é um espaço normado completo onde a norma está associada a um produto interno. No caso, o produto interno entre duas variáveis aleatórias XX e YY é X,Y=E[XY].\langle X, Y \rangle = \mathbb{E}[XY]. A norma L2(Ω)L^2(\Omega) é XL2=E[X2].\|X\|_{L^2} = \sqrt{\mathbb{E}[X^2]}.

Relações entre as convergências

Convergência quase certamente implica em convergência em probabilidade

Considere {Xn}n\{X_n\}_n convergindo quase certamente para X.X. Então P(XnX)=1.\mathbb{P}(X_n \rightarrow X) = 1. De outra forma, temos que

P(limnXnX)=0. \mathbb{P}(\lim_{n\rightarrow \infty} X_n \neq X) = 0.

Podemos escrever

{limnXnX}={limnXnX>0}=kN{limnXnXεk}, \left\{\lim_{n\rightarrow \infty} X_n \neq X\right\} = \left\{\lim_{n\rightarrow \infty} \|X_n - X\| > 0\right\} = \bigcup_{k\in \mathbb{N}}\left\{\lim_{n\rightarrow \infty} \|X_n - X\| \geq \varepsilon_k\right\},

para uma sequência qualquer {εk}kN\{\varepsilon_k\}_{k\in\mathbb{N}} de números positivos com εk0.\varepsilon_k \rightarrow 0. Isso implica em

P(limnXnXεk)=0,kN. \mathbb{P}\left(\lim_{n\rightarrow \infty} \|X_n - X\| \geq \varepsilon_k\right) = 0, \quad \forall k\in\mathbb{N}.

Como εk0,\varepsilon_k \rightarrow 0, então

P(limnXnXε)=0,ε>0, \mathbb{P}\left(\lim_{n\rightarrow \infty} \|X_n - X\| \geq \varepsilon\right) = 0, \quad \forall \varepsilon > 0,

o que significa dizer que XnXX_n \rightarrow X em probabilidade.

Convergência em média p>1p > 1 implica em convergência em média 1q<p1 \leq q < p

Supondo XnXX_n \rightarrow X em média p>1,p > 1, quando n,n\rightarrow \infty, e considerando 1q<p,1 \leq q < p, temos

E[XnXq]E[XnXp]q/p0, \mathbb{E}[|X_n - X|^q] \leq \mathbb{E}[|X_n - X|^p]^{q/p} \rightarrow 0,

quando n,n\rightarrow \infty, mostrando a convergência em média q.q.

Convergência em média p1p \geq 1 implica em convergência em probabilidade

Suponha que XnXX_n \rightarrow X em média p,p, com p1,p \geq 1, o que significa que

E[XnXp]0, \mathbb{E}[|X_n - X|^p] \rightarrow 0,

quando n.n\rightarrow \infty. Dado ε>0,\varepsilon > 0, temos, então,

P(XnX>ε)E[XnX]εE[XnXp]1/pε0, \mathbb{P}(|X_n - X| > \varepsilon) \leq \frac{\mathbb{E}[|X_n - X|]}{\varepsilon} \leq \frac{\mathbb{E}[|X_n - X|^p]^{1/p}}{\varepsilon} \rightarrow 0,

quando n,n\rightarrow \infty, o que significa dizer que XnXX_n \rightarrow X em probabilidade.

Convergência em probabilidade com erro somável implica em subsequência convergindo quase certamente

Suponha que, para todo ε>0,\varepsilon > 0, vale

n=1P(XnX>ε)<. \sum_{n=1}^\infty \mathbb{P}(|X_n - X| > \varepsilon) < \infty.

Então, pelo Lema de Borel-Cantelli,

P(lim supnXnX>ε)=0. \mathbb{P}(\limsup_{n\rightarrow\infty} |X_n - X| > \varepsilon) = 0.

Observe que não há ambiguidade acima, pois

lim supn{XnX>ε}=nk{XkX>ε}={n,knXkX>ε}={ lim supnXkX>ε}. \begin{align*} \limsup_{n\rightarrow\infty} \{|X_n - X| > \varepsilon\} & = \bigcap_n \bigcup_k \{|X_k - X| > \varepsilon\} \\ & = \left\{\forall n, \exists k\geq n |X_k - X| > \varepsilon \right\} \\ & = \left\{\;\limsup_{n\rightarrow \infty}|X_k - X| > \varepsilon\right\}. \end{align*}

Tomando uma sequência positiva εn0,\varepsilon_n \rightarrow 0, temos

P(lim supnXnX>0)=P(n(lim supnXnX>εn))=0. \mathbb{P}\left(\limsup_{n\rightarrow\infty} |X_n - X| > 0\right) = \mathbb{P}\left(\bigcup_n \left(\limsup_{n\rightarrow\infty} |X_n - X| > \varepsilon_n\right)\right) = 0.

Logo,

P(limnXn=X)=1, \mathbb{P}\left(\lim_{n\rightarrow \infty} X_n = X\right) = 1,

provando a convergência XnXX_n \rightarrow X quase certamente.

Convergência em probabilidade implica em subsequência convergindo quase certamente

Seja n1n_1 tal que

P(XnX>12)12,nn1 \mathbb{P}\left(|X_n - X| > \frac{1}{2}\right) \leq \frac{1}{2}, \qquad \forall n \geq n_1

e defina, recursivamente, nk>nk1n_k > n_{k-1} tal que

P(XnX>1k)12k,nnk. \mathbb{P}\left(|X_n - X| > \frac{1}{k}\right) \leq \frac{1}{2^k}, \qquad \forall n \geq n_k.

Temos

kP(XnkX>1k)<. \sum_k \mathbb{P}\left(|X_{n_k} - X| > \frac{1}{k}\right) < \infty.

Assim, para qualquer ε>0,\varepsilon > 0, temos

kP(XnkX>ε)<. \sum_k \mathbb{P}\left(|X_{n_k} - X| > \varepsilon\right) < \infty.

Pelo resultado anterior de convergência com erros somáveis, obtemos a convergência quase certamente da subsequência:

P(XnkX)=1. \mathbb{P}\left( X_{n_k} \rightarrow X \right) = 1.

Convergência em probabilidade de sequência monótona implica em convergência quase certamente

Vimos acima que convergência em probabilidade implica na convergência quase certamente de uma subsequência XnkX.X_{n_k} \rightarrow X. Ou seja, para quase todo ω,\omega, dado ε>0,\varepsilon > 0, existe jj tal que

Xε<Xnk<X+ε,kj. X - \varepsilon < X_{n_k} < X + \varepsilon, \qquad \forall k \geq j.

Como a sequência é monótona, digamos monótona não decrescente (é análogo caso seja não crescente), então, para todo nnj,n \geq n_j, temos nkn<nk+1,n_k \leq n < n_{k+1}, para algum kj.k \geq j. Assim,

Xε<XnkXnXnk+1<X+ε. X - \varepsilon < X_{n_k} \leq X_n \leq X_{n_{k+1}} < X + \varepsilon.

Em outras palavras, para todo ε>0,\varepsilon > 0, existe jj tal que

Xε<Xn<X+ε. X - \varepsilon < X_n < X + \varepsilon.

Isso significa que, quase certamente, XnX,X_n \rightarrow X, concluindo a demonstração.

Esperança convergindo e variância esvanecendo implica em convergência em probabilidade para constante

Suponha que {Xn}nN\{X_n\}_{n\in\mathbb{N}} seja um processo discreto real tal que

E[Xn]c,Var(Xn)=0. \mathbb{E}[X_n] \rightarrow c, \quad \mathrm{Var}(X_n) = 0.

Então

P(Xnc>ε)=Xnc>ε dFXn(x), \mathbb{P}\left(|X_n - c| > \varepsilon\right) = \int_{|X_n - c| > \varepsilon} \;\mathrm{d}F_{X_n}(x),

onde FXn(x)=P(Xn<x)F_{X_n}(x) = \mathbb{P}(X_n < x) é a função de probabilidade acumulada de Xn.X_n.

Como 1(Xnc)2/ε21 \leq (X_n - c)^2 / \varepsilon^2 no domínio de integração,

P(Xnc>ε)1ε2R(Xnc)2 dFXn(x)1ε2R(XnE[Xn])2 dFXn(x)+1ε2R(E[Xn]c)2 dFXn(x)=1ε2Var(Xn)+1ε2(E[Xn]c)20,n, \begin{align*} \mathbb{P}\left(|X_n - c| > \varepsilon\right) & \leq \frac{1}{\varepsilon^2}\int_{\mathbb{R}} (X_n - c)^2 \;\mathbb{d}F_{X_n}(x) \\ & \leq \frac{1}{\varepsilon^2}\int_{\mathbb{R}} (X_n - E[X_n])^2 \;\mathrm{d}F_{X_n}(x) + \frac{1}{\varepsilon^2}\int_{\mathbb{R}} (E[X_n] - c)^2 \;\mathrm{d}F_{X_n}(x) \\ & = \frac{1}{\varepsilon^2}\mathrm{Var}(X_n) + \frac{1}{\varepsilon^2}(E[X_n] - c)^2 \rightarrow 0, \quad n\rightarrow \infty, \end{align*}

provando a convergência em probabilidade para uma constante.

Exemplos

Sequências de normais dependentes

Considere uma variável aleatória normal XN(0,1)X \sim \mathcal{N}(0, 1) e defina a sequência

Xn=1nX. X_n = \frac{1}{n}X.

Observe que XnN(0,1/n2).X_n \sim \mathcal{N}(0, 1/n^2). Vamos mostrar que essa sequência converge para zero, cuja distribuição é a delta de Dirac 0Dirac(0)=N(0,0),0 \sim \mathrm{Dirac}(0) = \mathcal{N}(0, 0), em vários sentidos.

Os caminhos amostrais são

tXn(ω)=ωn. t\mapsto X_n(\omega) = \frac{\omega}{n}.

Observe que essas variáveis não são independentes. Para cada ω,\omega, temos

Xn(ω)=ωn0,n0. X_n(\omega) = \frac{\omega}{n} \rightarrow 0, \qquad n \rightarrow 0.

Ou seja, XnX_n converge para 00 quase certamente. Isso implica nas outras convergências. Mas podemos prová-las diretamente. De fato, para qualquer ε>0,\varepsilon > 0,

P(Xn>ε)=P(X>nε)0,n0, \mathbb{P}(|X_n| > \varepsilon) = \mathbb{P}(|X| > n\varepsilon ) \rightarrow 0, \qquad n \rightarrow 0,

mostrando a convergência em probabilidade. Agora, observe que a função de distribuição acumulada da variável limite (igual a zero quase sempre) é

F(x)={0,x<0,1,x0. F(x) = \begin{cases} 0, & x < 0, \\ 1, & x \geq 0. \end{cases}

Os pontos de continuidade de FF são os pontos x0.x \neq 0. Nesses pontos, temos,

P(Xnx)=P(Xnx){0,x<0,1,x>0. \mathbb{P}(X_n \leq x) = \mathbb{P}(X \leq n x) \rightarrow \begin{cases} 0, & x < 0, \\ 1, & x > 0. \end{cases}

No ponto de descontinuidade x=0,x = 0, temos

P(Xn0)=12, \mathbb{P}(X_n \leq 0) = \frac{1}{2},

mas isso não atrapalha a convergência Xn0X_n \rightarrow 0 em distribuição.

A convergência em média quadrática pode ser obtida diretamente da variância de cada termo da sequência:

P(Xn02)=Var(Xn)=1n20,n. \mathbb{P}(|X_n - 0|^2) = \mathrm{Var}(X_n) = \frac{1}{n^2} \rightarrow 0, \qquad n \rightarrow \infty.

Sequências de normais independentes

Podemos considerar sequências independentes definindo Ω=RN={ω=(ω1,ω2,); ωnR}\Omega = \mathbb{R}^\mathbb{N} = \{\omega = (\omega_1, \omega_2, \ldots); \;\omega_n\in \mathbb{R}\} e definindo P\mathbb{P} por

P(Xn1x1,,Xnkxk)=P(Xn1x1)××P(Xnkxk), \mathbb{P}(X_{n_1} \leq x_1, \ldots, X_{n_k} \leq x_k) = \mathbb{P}(X_{n_1}\leq x_1)\times \cdots \times \mathbb{P}(X_{n_k}\leq x_k),

onde a distribuição de cada XnX_n é uma Gaussiana

12πσn2ex2/2σn2, \frac{1}{\sqrt{2\pi \sigma_n^2}}e^{-x^2/2\sigma_n^2},

onde σn>0.\sigma_n > 0.

Convergências quase certamente e em probabilidade não implicam em convergência em média

Seja Ω=[0,1]\Omega = [0, 1] com medida de probabilidade P\mathbb{P} uniforme em Ω.\Omega. Considere a sequência XnX_n definida por

Xn(ω)=n2χ[0,1/n](ω),nN, X_n(\omega) = n^2\chi_{[0, 1/n]}(\omega), \qquad n \in \mathbb{N},

em Ω=[0,1],\Omega = [0, 1], onde χ[0,1/n](ω),\chi_{[0, 1/n]}(\omega), ωΩ\omega\in\Omega é a função característica do intervalo [0,1/n].[0, 1/n]. Então

Xn(ω)0, X_n(\omega) \rightarrow 0,

para todo ω(0,1],\omega \in (0, 1], portanto XnX=0,X_n \rightarrow X=0, quase certamente. Com isso, também temos a convergência em probabilidade, o que pode também ser obtido explicitamente, visto que para 0<ε1,0 < \varepsilon \leq 1, temos

P(XnXε)=P(Xnε)=1n0, \mathbb{P}(|X_n - X| \geq \varepsilon) = \mathbb{P}(X_n \geq \varepsilon) = \frac{1}{n} \rightarrow 0,

de modo que Xn0X_n \rightarrow 0 também em probabilidade. No entanto,

E[XnX]=E[Xn]=n2n=n, \mathbb{E}[|X_n - X|] = \mathbb{E}[X_n] = \frac{n^2}{n} = n \rightarrow \infty,

de modo que XnX_n não converge para X=0X=0 em média, nem em qualquer média p>1.p > 1.

Convergência em probabilidade não implica em convergência quase certamente

Novamente considere Ω=[0,1]\Omega = [0, 1] com medida de probabilidade P\mathbb{P} uniforme em Ω.\Omega. Para cada nN,n\in\mathbb{N}, escrevemos k=log2(n)k = \log_2(n) e j=n2k,j = n - 2^k, de modo que n=2k+j,n = 2^k + j, com kNk\in \mathbb{N} e 0j2k1.0 \leq j \leq 2^k-1. Com essa decomposição (única), definimos a sequência

Xn=χ[j2k,j+12k]. X_n = \chi_{\left[\frac{j}{2^k}, \frac{j+1}{2^k}\right]}.

Para essa sequência, temos Xn(ω)X_n(\omega) assumindo os valores 00 e 11 indefinidamente, para todo ωΩ,\omega\in\Omega, de modo que XnX_n não converge para X=0X=0 em nenhum ponto. Por outro lado, para qualquer 0<ε<1,0 < \varepsilon < 1, temos

P(XnX>ε)=P(Xn>ε)=12k0,n. \mathbb{P}(|X_n - X| > \varepsilon) = \mathbb{P}(X_n > \varepsilon) = \frac{1}{2^k} \rightarrow 0, \qquad n\rightarrow \infty.

Portanto, XnX=0X_n \rightarrow X = 0 em probabilidade mas não converge em nenhum ponto.

Last modified: June 01, 2026. Built with Franklin.jl, using the Book Template.