Code
dag_mediacao <- dagify(
M ~ X,
Y ~ M + X,
coords = list(
x = c(X = 0, M = 1, Y = 2),
y = c(X = 0, M = 0, Y = 0)
)
)
ggdag(dag_mediacao) + theme_dag()
Um grafo acíclico dirigido (DAG) é uma representação gráfica de relações causais. A seta básica \(X \rightarrow Y\) carrega vários significados simultâneos:
Duas propriedades importantes das causas nos DAGs:
Setas unidirecionais não funcionam em ciclos. Um DAG deve ser acíclico — cadeias do tipo \(A \rightarrow D \rightarrow E \rightarrow F \rightarrow A\) são proibidas. Há uma justificativa lógica: ciclos geram tautologias. Há também uma justificativa operacional: o aciclo viabiliza certas propriedades matemáticas que seriam impossíveis de outra forma.
É muito difícil escolher quais setas não criar, porque o mundo é de fato complicado. A melhor forma de decidir quais setas incluir é por meio de revisão de literatura — em particular, revisão sistemática e meta-análise.
O DAG não informa nada sobre a forma funcional da relação entre as variáveis — apenas sobre sua existência e direção. A revisão de literatura preenche essa lacuna.
Na prática, é necessário simplificar. Quatro estratégias úteis:
Toda a estrutura de um DAG pode ser decomposta em três tipos de relações entre três variáveis:
\(X \rightarrow M \rightarrow Y\) — e possivelmente também \(X \rightarrow Y\) diretamente.
dag_mediacao <- dagify(
M ~ X,
Y ~ M + X,
coords = list(
x = c(X = 0, M = 1, Y = 2),
y = c(X = 0, M = 0, Y = 0)
)
)
ggdag(dag_mediacao) + theme_dag()
Um determinante comum \(Z\) que causa tanto \(X\) quanto \(Y\):
dag_fork <- dagify(
X ~ Z,
Y ~ Z,
coords = list(
x = c(Z = 1, X = 0, Y = 2),
y = c(Z = 1, X = 0, Y = 0)
)
)
ggdag(dag_fork) + theme_dag()
Duas causas independentes que convergem num mesmo efeito: \(X \rightarrow C \leftarrow Y\).
dag_collider <- dagify(
C ~ X + Y,
coords = list(
x = c(X = 0, Y = 2, C = 1),
y = c(X = 1, Y = 1, C = 0)
)
)
ggdag(dag_collider) + theme_dag()
Suponha que atores em Hollywood sejam selecionados por talento ou beleza — e que, na população geral, talento e beleza sejam independentes. Uma vez dentro desse grupo, observamos uma correlação negativa entre as duas características: quanto menos talentoso, mais belo — e vice-versa.
Essa correlação não existe na população; ela é criada pela seleção. Beleza e talento explicam conjuntamente a chance de estar em Hollywood — que é o collider.
Controlar por um collider tem o mesmo efeito de selecionar uma amostra que é fruto de um collider. Colliders são armadilhas como variáveis de controle.
O DAG nos ajuda a desenhar diversas formas funcionais que, na prática, deveriam produzir os mesmos efeitos causais para uma variável de interesse. Um único DAG pode gerar dezenas de proposições empiricamente testáveis — independências condicionais, regressões equivalentes, restrições de sobreidentificação.
A função principal dos DAGs é, portanto, gerar implicações observáveis que podem ser confrontadas com os dados.