2.8. Transformações de variáveis aleatórias

A partir de uma ou mais variáveis aleatórias, podemos obter novas variáveis aleatórias aplicando transformações no espaço de eventos.

Transformação de uma variável aleatória

Por exemplo, se XX é uma variável aleatória com espaço de eventos (Σ1,E1)(\Sigma_1, \mathcal{E_1}) e f:(Σ1,E1)(Σ2,E2)f:(\Sigma_1, \mathcal{E_1}) \rightarrow (\Sigma_2, \mathcal{E_2}) é uma função mensurável desse espaço em outro, então

Y=f(X) Y = f(X)

denota uma variável aleatória com eventos em Σ2.\Sigma_2. Dado um evento EE2,E \in \mathcal{E}_2, a probabilidade de YY assumir valores em EE é dada por

PY(YE)=PX(f(X)E)=PX(Xf1(E)), \mathbb{P}_Y(Y \in E) = \mathbb{P}_X(f(X) \in E) = \mathbb{P}_X(X \in f^{-1}(E)),

onde

f1(E)={xΣ1; f(x)E}. f^{-1}(E) = \{x \in \Sigma_1; \;f(x)\in E\}.

Um dos exemplos mais triviais possíveis é

Y=aX+b Y = aX + b

No caso de XX ser uma distribuição uniforme, então YY também será uniforme:

XUnif(x1,x2)YUnif(b+ax1,b+ax2). X \sim \mathrm{Unif}(x_1, x_2) \quad \Longrightarrow \quad Y \sim \mathrm{Unif}(b + ax_1, b + ax_2).

No caso de XX ser normal, então YY também será normal:

XN(μ,σ2)YN(b+aμ,a2σ2). X \sim \mathcal{N}(\mu, \sigma^2) \quad \Longrightarrow \quad Y \sim \mathcal{N}(b + a\mu, a^2\sigma^2).

Observe, por exemplo, que

E[Y]=E[aX+b]=aE[X]+b=aμ+b \mathbb{E}[Y] = \mathbb{E}[aX + b] = a\mathbb{E}[X] + b = a\mu + b

e

E[(YE[Y])2]=E[(aX+baμb)2]=a2E[(Xμ)2]=a2σ2. \mathbb{E}[(Y - \mathbb{E}[Y])^2] = \mathbb{E}[(aX + b - a\mu - b)^2] = a^2\mathbb{E}[(X-\mu)^2] = a^2\sigma^2.

Mas isso não mostra que YY é uma normal. Para ver isso, seja FF a função de probabilidade acumulada de X,X, i.e.

FX(x)=P(Xx)=12πσ2xe(ξμ)22σ2 dξ. F_X(x) = \mathbb{P}(X \leq x) = \frac{1}{\sqrt{2\pi \sigma^2}}\int_{-\infty}^x e^{- \frac{(\xi - \mu)^2}{2\sigma^2}}\;\mathrm{d}\xi.

Então a função de probabilidade acumulada de YY é

FY(y)=P(Yy)=P(aX+by)=P(Xyba)=FX(yba)=12πσ2ybae(ξμ)22σ2 dξ. F_Y(y) = \mathbb{P}(Y \leq y) = \mathbb{P}(aX + b \leq y) = \mathbb{P}\left(X \leq \frac{y - b}{a}\right) = F_X\left(\frac{y - b}{a}\right) = \frac{1}{\sqrt{2\pi \sigma^2}}\int_{-\infty}^{\frac{y - b}{a}} e^{- \frac{(\xi - \mu)^2}{2\sigma^2}}\;\mathrm{d}\xi.

Fazendo η=b+aξ,\eta = b + a\xi, de modo que (ηb)/a=ξ(\eta - b)/a = \xi e dξ=dη/a,\mathrm{d}\xi = \mathrm{d}\eta / a, temos

FY(y)=12πa2σ2ye(ηbaμ)22a2σ2 dη. F_Y(y) = \frac{1}{\sqrt{2\pi a^2\sigma^2}}\int_{-\infty}^y e^{- \frac{(\eta - b - a\mu)^2}{2a^2\sigma^2}}\;\mathrm{d}\eta.

Isso prova que YN(b+aμ,a2σ2).Y \sim \mathcal{N}(b + a\mu, a^2\sigma^2).

Transformação de várias variáveis aleatórias

Também podemos fazer isso para várias variáveis aleatórias, digamos X1,,Xn,X_1, \ldots, X_n, em espaços de probabilidades (Ωj,Aj,PX1),(\Omega_j, \mathcal{A}_j, \mathbb{P}_{X_1}), com valores em (Σj,Ej),(\Sigma_j, \mathcal{E}_j), através de uma função mensurável

f:Σ1××Σ2Σ, f: \Sigma_1 \times \cdots \times \Sigma_2 \rightarrow \Sigma,

em um espaço de eventos (Σ,E).(\Sigma, \mathcal{E}). O caso mais comum é quando todos os espaços de amostras são idênticos e quando todos os espaços de eventos também são idênticos, mas isso não é necessário.

Com isso, podemos definir uma variável aleatória

Y=f(X1,,Xn). Y = f(X_1, \ldots, X_n).

Nesse caso, dado um evento EE,E\in \mathcal{E}, temos

PY(YE)=P((X1,,Xn)f1(E)), \mathbb{P}_Y(Y \in E) = \mathbb{P}((X_1, \dots, X_n) \in f^{-1}(E)),

onde P\mathbb{P} se refere à probabilidade conjunta P=P1××Pn,\mathbb{P} = \mathbb{P}_1 \times \cdots \times \mathbb{P}_n, na σ\sigma-algebra A=A1×An\mathcal{A} = \mathcal{A}_1 \times \cdots \mathcal{A}_n gerada no espaço produto Ω=Ω1××Ωn.\Omega = \Omega_1 \times \cdots \times \Omega_n.

De fato, este pode ser visto como um caso particular do primeiro, considerando-se a variável aleatória vetorial X=(X1,,Xn)X = (X_1, \ldots, X_n) em (Ω,A,P),(\Omega, \mathcal{A}, \mathbb{P}), com f:Σ1××ΣnΣ.f:\Sigma_1 \times \cdots \times \Sigma_n \rightarrow \Sigma.

Combinação linear de distribuições normais independentes

Como exemplo, sejam X1X_1 e X2X_2 duas distribuições normais independentes, digamos X1,X2N(0,1).X_1, X_2 \sim \mathcal{N}(0, 1). Definimos

X=a1X1+a2X2, X = a_1 X_1 + a_2 X_2,

onde a1,a2R.a_1, a_2 \in \mathbb{R}. Dados ω=(ω1,ω2)\omega = (\omega_1, \omega_2) no espaço amostral Ω1×Ω2,\Omega_1 \times \Omega_2, temos uma realização

X(ω)=a1X1(ω1)+a2X(ω2). X(\omega) = a_1 X_1(\omega_1) + a_2 X(\omega_2).

Podemos mostrar que XX também é uma normal, com

XN(0,a12+a22). X \sim \mathcal{N}(0, a_1^2 + a_2^2).

Mais geralmente,

X1N(μ1,σ12), X2N(μ2,σ22)a1X1+a2X2N(a1μ1+a2μ2,a12σ12+a22σ22). X_1 \sim \mathcal{N}(\mu_1, \sigma_1^2), \; X_2 \sim \mathcal{N}(\mu_2, \sigma_2^2) \quad \Longrightarrow \quad a_1 X_1 + a_2 X_2 \sim \mathcal{N}(a_1\mu_1 + a_2\mu_2, a_1^2\sigma_1^2 + a_2^2\sigma_2^2).

Naturalmente, isso pode ser generalizado para uma combinação linear de um número arbitrário de normais.

O fato da combinação linear ser normal requer um pouco mais de trabalho, como veremos a seguir, mas as médias e variâncias podem ser obtidas facilmente. De fato, pela linearidade da esperança,

E[a1X1+a2X2]=a1E[X1]+a2E[X2]=a1μ1+a2μ2, \mathbb{E}[a_1X_1 + a_2X_2] = a_1\mathbb{E}[X_1] + a_2\mathbb{E}[X_2] = a_1\mu_1 + a_2\mu_2,

ao passo que

E[(a1X1+a2X2a1μ1+a2μ2)2]=E[(a1(X1μ1)+a2(X2μ2))2]=a12E[(X1μ1)2]+2a1a2E[(X1μ1)(X2μ2)]+a22E[(X2μ2)2]=a12σ12+2a1a2E[X1μ1]E[X2μ2]+a22σ22=a12σ12+a22σ22. \begin{align*} \mathbb{E}[(a_1X_1 + a_2X_2 - a_1\mu_1 + a_2\mu_2)^2] & = \mathbb{E}[(a_1(X_1 - \mu_1) + a_2(X_2 - \mu_2))^2] \\ & = a_1^2\mathbb{E}[(X_1 - \mu_1)^2] + 2a_1a_2\mathbb{E}[(X_1 - \mu_1)(X_2 - \mu_2)] + a_2^2\mathbb{E}[(X_2 - \mu_2)^2] \\ & = a_1^2\sigma_1^2 + 2a_1a_2\mathbb{E}[X_1 - \mu_1]\mathbb{E}[X_2-\mu_2] + a_2^2\sigma_2^2 \\ & = a_1^2\sigma_1^2 + a_2^2\sigma_2^2. \end{align*}

Quanto ao fato da combinação linear ser uma normal, há várias demonstrações disso, por exemplo através de cálculo explícito da função acumulada de probabilidade ou da função característica. Mas a mais simples e elegante usa argumentos de simetria da normal, mais precisamente de argumentos de simetria por rotação da função densidade de probabilidades conjuntas de normais independentes com mesma variância. Mesmo que elas não tenham a mesma variância, podemos reescaloná-las. Vamos seguir, aqui, a demonstração como feita em Eisenberg & Sullivan (2008). Veja esse mesmo artigo para comentários sobre outras demonstrações.

Se X1N(μ1,σ12)X_1 \sim \mathcal{N}(\mu_1, \sigma_1^2) e X2N(μ2,σ22),X_2 \sim \mathcal{N}(\mu_2, \sigma_2^2), então podemos escrever X1=μ1+σ1Y1X_1 = \mu_1 + \sigma_1 Y_1 e X2=μ2+σ2Y2,X_2 = \mu_2 + \sigma_2 Y_2, com Y1,Y2N(0,1).Y_1, Y_2 \sim \mathcal{N}(0, 1). Assim,

X=a1μ1+a2μ2+a1σ1Y1+a2σ2Y2. X = a_1\mu_1 + a_2\mu_2 + a_1\sigma_1 Y_1 + a_2\sigma_2 Y_2.

Nesse caso, XX é apenas uma translação de uma combinação de normais com média zero e variância um:

Xa1μ1+a2μ2=a1σ1Y1+a2σ2Y2 X - a_1\mu_1 + a_2\mu_2 = a_1\sigma_1 Y_1 + a_2\sigma_2 Y_2

Então basta mostrar que

b1Y1+b2Y2N(0,b12+b22), b_1 Y_1 + b_2 Y_2 \sim \mathcal{N}(0, b_1^2 + b_2^2),

com b1=a1σ1b_1 = a_1\sigma_1 e b2=a2σ2.b_2 = a_2\sigma_2. Para provar isso, trabalhamos com a função acumulada de probabilidade (conjunta)

F(x)=P(b1Y1+b2Y2x). F(x) = \mathbb{P}(b_1 Y_1 + b_2 Y_2 \leq x).

Como a função densidade de probabilidades da distribuição conjunta é simétrica em relação a rotações em torno da origem e como a reta b1Y1+b2Y2=xb_1 Y_1 + b_2 Y_2 = x está a uma distância

d=xb12+b22 d = \frac{x}{\sqrt{b_1^2 + b_2^2}}

da origem, então podemos fazer uma rotação do semiplano b1Y1+b2Y2xb_1 Y_1 + b_2 Y_2 \leq x para o semiplano Y1d.Y_1 \leq d.

Fazendo isso, teremos a mesma probabilidade:

F(x)=P(b1Y1+b2Y2x)=P(Y1d)=FY1(xb12+b22)=F(b12+b22)Y1(x). F(x) = \mathbb{P}(b_1 Y_1 + b_2 Y_2 \leq x) = \mathbb{P}(Y_1 \leq d) = F_{Y_1}\left(\frac{x}{\sqrt{b_1^2 + b_2^2}}\right) = F_{(b_1^2 + b_2^2)Y_1}(x).

Ou seja, FF é igual à função de densidade de probabilidades da normal N(0,b12+b22),\mathcal{N}(0, b_1^2 + b_2^2), concidindo, portanto, com essa normal.

Um caso particular que será explorado na demonstração de existência de um processo de Wiener é a independência da soma e da diferença de normais independentes e identicamente distribuídas com média zero.

Sejam X,YN(0,σ2)X, Y \sim \mathcal{N}(0, \sigma^2) independentes. Defina

Z=X+Y,W=XY. Z = X + Y, \qquad W = X - Y.

Primeiramente, como combinações lineares de normais, temos, pelo que acabamos de ver, que ZZ e WW também são normais. Como XX e YY têm média zero e variância σ2,\sigma^2, então ZZ e WW também têm média zero e variância a2σ12+b2σ22=2σ2,a^2\sigma_1^2 + b^2\sigma_2^2 = 2\sigma^2, onde σ1=σ2=σ,\sigma_1 = \sigma_2 = \sigma, a=1a = 1 e b=±1.b = \pm 1. Assim,

Z,WN(0,2σ2). Z, W \sim \mathcal{N}(0, 2\sigma^2).

Agora, para ver a independência entre ZZ e W,W, sabendo que a média de cada uma das variáveis é zero, calculamos

E[ZW]=E[(X+Y)(XY)]=E[X2Y2]=E[X2]E[Y2]=σ2σ2=0, \mathbb{E}[ZW] = \mathbb{E}[(X+Y)(X-Y)] = \mathbb{E}[X^2 - Y^2] = \mathbb{E}[X^2] - \mathbb{E}[Y^2] = \sigma^2 - \sigma^2 = 0,

nos dando que a correlação entre as duas variáveis é nula e portanto elas são independentes.

Marginais normais sem vetor ser normal

Um vetor aleatório pode ter marginais normais sem ele ser uma normal multivariada. Considere, por exemplo, XN(0,1)X \sim \mathcal{N}(0, 1) e Y=±X=(2B1)X,Y = \pm X = (2B - 1)X, onde BBernoulli(1/2).B \sim \operatorname{Bernoulli}(1/2). Temos

P(Yy)=12P(YyB=0)+12P(YyB=1)=12P(Xy)+12P(Xy). \mathbb{P}(Y \leq y) = \frac{1}{2}\mathbb{P}(Y \leq y | B = 0) + \frac{1}{2}\mathbb{P}(Y \leq y | B = 1) = \frac{1}{2}\mathbb{P}(X \leq y) + \frac{1}{2}\mathbb{P}(-X \leq y).

Pela simetria da distribuição de XN(0,1),X \sim \mathcal{N}(0, 1), temos

P(Xy)=P(Xy)=P(Xy), \mathbb{P}(-X \leq y) = \mathbb{P}(X \geq -y) = \mathbb{P}(X \leq y),

de modo que

P(Yy)=12P(Xy)+12P(Xy)=P(Xy), \mathbb{P}(Y \leq y) = \frac{1}{2}\mathbb{P}(X \leq y) + \frac{1}{2}\mathbb{P}(X \leq y) = \mathbb{P}(X \leq y),

mostrando que a distribuição de YY é normal. Mas a distribuição do vetor aleatório (X,Y)(X, Y) não é uma normal bivariada.

Exercícios

  1. Seja YY uma variável aleatória real e defina X=sin(Y).X = \sin(Y). Suponha que E[Y]=0.\mathbb{E}[Y] = 0. Mostre que E[X]=0\mathbb{E}[X] = 0 e Var(X)Var(Y).\mathrm{Var}(X) \leq \mathrm{Var}(Y).

Last modified: June 01, 2026. Built with Franklin.jl, using the Book Template.