4 Aula 4
4.1 Resultados potenciais
Para cada unidade \(i\), definimos dois resultados potenciais:
- \(Y_i(1)\): resultado que seria observado se a unidade recebesse o tratamento (\(A_i = 1\))
- \(Y_i(0)\): resultado que seria observado se a unidade não recebesse o tratamento (\(A_i = 0\))
O resultado observado é \(Y_i = A_i \cdot Y_i(1) + (1 - A_i) \cdot Y_i(0)\).
Problema fundamental da inferência causal: para qualquer indivíduo, observamos apenas um resultado potencial — nunca observamos o contrafactual. O efeito causal individual \(Y_i(1) - Y_i(0)\) é, portanto, fundamentalmente não identificável.
SUTVA
O pressuposto SUTVA (Stable Unit Treatment Value Assumption) tem duas partes:
Sem interferência: o resultado potencial de \(i\) não depende do tratamento atribuído a \(j \neq i\) \[Y_i(a) \perp\!\!\!\perp A_j \quad \forall\, i \neq j\]
Versão única do tratamento: não há versões ocultas de \(A\) — cada nível de tratamento é bem definido e consistente entre unidades
SUTVA é necessário para que a notação \(Y_i(a)\) seja bem definida e para que a consistency valha.
4.2 Estimandos causais
Dado que o efeito individual não é identificável, trabalhamos com efeitos médios populacionais:
ATE (Average Treatment Effect) — efeito médio na população: \[\tau_{\text{ATE}} = \mathbb{E}[Y(1) - Y(0)]\]
ATT (Average Treatment Effect on the Treated) — efeito médio entre os tratados: \[\tau_{\text{ATT}} = \mathbb{E}[Y(1) - Y(0) \mid A = 1]\]
ATU (Average Treatment Effect on the Untreated) — efeito médio entre os não tratados: \[\tau_{\text{ATU}} = \mathbb{E}[Y(1) - Y(0) \mid A = 0]\]
Os três estimandos se relacionam pela lei da expectativa total:
\[\tau_{\text{ATE}} = P(A=1)\cdot\tau_{\text{ATT}} + P(A=0)\cdot\tau_{\text{ATU}}\]
ATE, ATT e ATU só coincidem quando o efeito do tratamento é homogêneo entre tratados e não tratados — o que raramente é garantido em estudos observacionais.
4.3 Experimento randomizado
Em um experimento randomizado, a atribuição do tratamento \(A\) obedece a um mecanismo aleatório. A principal consequência é:
\[ \text{Randomização} \Rightarrow A \perp\!\!\!\perp (Y^0, Y^1) \quad \text{(em média)} \]
Isso torna o dado “faltante ao acaso” (missing at random): a atribuição do tratamento é independente do que se esperaria desse tratamento para cada indivíduo particular. Em um experimento randomizado, o resultado potencial não observado surge ao acaso, por design.
4.4 Exchangeability
Exchangeability marginal
\[ Y^a \perp\!\!\!\perp A, \quad a \in \{0, 1\} \]
Também chamada de independência contrafactual. Significa que os resultados potenciais são independentes do tratamento recebido — o que só é plausível quando a alocação é genuinamente aleatória.
Identificação em experimento
A exchangeability marginal permite identificar o ATE diretamente. A derivação parte da definição e aplica a independência:
\[ \mathbb{E}[Y(1)] \overset{(1)}{=} \mathbb{E}[Y(1) \mid A = 1] \overset{(2)}{=} \mathbb{E}[Y \mid A = 1] \]
onde (1) usa exchangeability (\(Y(1) \perp\!\!\!\perp A\)) e (2) usa consistency (\(Y = Y(1)\) quando \(A = 1\)). Analogamente para \(\mathbb{E}[Y(0)]\). Portanto:
\[ \tau_{\text{ATE}} = \mathbb{E}[Y(1)] - \mathbb{E}[Y(0)] = \mathbb{E}[Y \mid A = 1] - \mathbb{E}[Y \mid A = 0] \]
Estimação ingênua e viés de seleção
Em estudos observacionais, a diferença de médias observadas é um estimador viesado. Para ver isso, decomponha:
\[ \underbrace{\mathbb{E}[Y \mid A=1] - \mathbb{E}[Y \mid A=0]}_{\text{diferença observada}} = \underbrace{\mathbb{E}[Y(1) - Y(0) \mid A=1]}_{\text{ATT}} + \underbrace{\mathbb{E}[Y(0) \mid A=1] - \mathbb{E}[Y(0) \mid A=0]}_{\text{viés de seleção}} \]
O viés de seleção mede a diferença nos resultados potenciais de controle entre tratados e não tratados — isto é, o quanto os grupos diferiam antes do tratamento. Em experimentos, a randomização garante que esse termo seja zero em esperança.
4.5 Randomização condicional
Ocorre quando a probabilidade de receber o tratamento varia por um fator prognóstico \(L\). Nesse caso, a exchangeability só vale dentro dos estratos de \(L\):
\[ Y^a \perp\!\!\!\perp A \mid L \quad \text{(exchangeability condicional)} \]
É como se fosse o mundo observacional: existe alguma variável na qual é preciso condicionar. A diferença é que, por design, sabe-se que condicionar em \(L\) é suficiente para fazer a análise.
Sob exchangeability condicional, o ATE é identificado pela fórmula de padronização:
\[ \tau_{\text{ATE}} = \mathbb{E}_L\!\left[\mathbb{E}[Y \mid A = 1, L] - \mathbb{E}[Y \mid A = 0, L]\right] \]
4.6 Estudos observacionais
Em estudos observacionais:
- O pesquisador não controla o tratamento \(A\)
- A ideia é analisar os dados “como se fossem” de um experimento condicionalmente randomizado
- Isso exige condições explícitas de identificabilidade
Três condições para inferência causal em estudos observacionais
1. Consistency — A intervenção precisa estar bem definida e o resultado observado deve corresponder ao resultado potencial sob o tratamento recebido:
\[Y_i = Y_i(a) \quad \text{se } A_i = a\]
2. Exchangeability — Após condicionar em \(L\), tratados e não tratados devem ser comparáveis em termos de resultados potenciais:
\[Y^a \perp\!\!\!\perp A \mid L\]
3. Positivity — Em cada estrato relevante de \(L\), deve haver chance positiva de observar ambos os tratamentos:
\[P(A = a \mid L = l) > 0 \quad \forall\, a,\, l\]
As três condições — consistency, exchangeability e positivity — são pressupostos não testáveis diretamente. Em estudos observacionais, sua plausibilidade depende do conhecimento substantivo sobre o fenômeno estudado.