<인과추론> 3. 보충) 잠재 결과 프레임워크 / 인과추론의 가정 / 편향과 ATT&ATU&ATE

|

1. 잠재적 결과 프레임워크와 가정

Potential Outcome Framework

“Neyman-Rubin Causal Model”

  • Counterfactual = 관측되지 않은 사실 = 반사실적 사실
  • 이론적인 Causal effect = (Actual outcome if treated) - (Potential outcome if not treated)
  • 현실에서는, 한 사람이 동시에 두 가지 상태를 관측할 수 없다. 따라서
    • 관측되는 Causal effect = (Actual outcome for treated if treated) - (Actual outcome for untreated if not treated)
  • 이때, 이론에서의 Potential outcome if not treated와 현실에서의 Actual outcome for untreated if not treated가 같을 수는 없다.
    • 이 둘을 다르게 하는 요인을 편향(선택 편향, selection bias)라고 부르고 이 편향을 없애기 위한 과정을 식별(identification)이라고 한다.

일반적으로 전체 그룹에서 식별된 인과효과를 ATE라고 한다. 인과 추론의 고도화된 목적은, 전체에 대한 평균 처치 효과가 아닌, 개인에게의 처치 효과까지를 추론해내는 것 (=개인화)

ATE → CATE(Conditional ATE) / HTE(heterogeneous) → ITE (Individual)


PO Framework에서 인과효과를 식별하기 위한 가정들

Assumption 1. SUTVA (Stable Unit Treatment Value Assumption)

  • 1-1. Counterfactual consistency
    • $Y = Y(1) if T=1, Y=Y(0) if T=0$
    • $T_i$를 받은 unit의 관측된 $Y_i$는 $T_i$에 대한 잠재 결과와 같다.
    • 즉, 실제 관측되는 결과와 잠재 결과는 같다.
    • ex) 만약 신약을 처치 받았는데 복용을 안 하거나 제대로 투여되지 않았다면 가정에 위배
  • 1-2. No Interference
    • 한 unit의 잠재 결과는 다른 unit의 처리 여부나 잠재 결과에 의해 영향을 받지 않아야 한다.
    • = no spillover effects
    • ex) A가 백신을 맞았는데 집단 면역의 효과로 함께 거주하는 B의 결과에 영향을 미쳤다.

Assumption 2. Ignorability assumption

\[Y(t)\perp T\|X, t=0,1\]
  • =unconfoundedness
  • = selection on observables
    • 주어진 X값에 대해 통제했을 때 조건부 독립임을 의미
  • 사실 더 강한 NUC(No Unmeasured Confounders) Assumption이 있다. 다만 이는 현실성이 떨어지는 가정이기 때문에 weak version인 ignorability assumption으로 대체함
    • = 모든 교란변수는 X에 포함되어있다는 가정

Assumption 3. Positivity

  • 모든 X 값에 대해, 처치를 받을 확률은 0 이상이어야 한다.

위 가정들이 만족되어야만 인과효과를 식별할 수 있다.


2. ATT, ATU, and ATE

  • ATE: ATE in the total population
  • ATT: ATE in the subpopulation where T = 1
  • ATU: ATE in the subpopulation where T = 0

ATE는 처치를 받은 집단과 받지 않은 집단 모두에서의 평균 처치 효과이다. 그럼 우리가 실제로 구하게 될 인과 효과는 ATE일까 ATT일까?

앞서 배운 것처럼, 추정된 효과는 아래와 같이 분해할 수 있다.

\[\underbrace{E[Y_1-Y_0\|T=1]}_{\text{ATT}} + \underbrace{\{E[Y_0\|T=1] - E[Y_0\|T=0]\}}_{\text{편향}}\]
  • 여기서 selection bias를 없앤다면 남는 것은 ATT 이다.
  • 즉, ceteris paribus를 만족하는 control group을 활용해서 구할 수 있는 인과 효과는 ATE가 아니다!


그럼 언제 ATT가 ATE와 같아지는가?

  • ATE는 ATT와 ATU의 가중 평균이다.
    • $ATE = \pi ATT + (1-\pi) ATU$
    • $ATT = ATT + ATE - ATE$
      • $ATT = ATE + (1-\pi) (ATT- ATU)$
  • 위 에서 본 인과 효과 식에 대입해보면
    • Observed effect of treatment = ATT + selection bias
      • = ATE + (1-pi) (ATT - ATU) + Selection bias
      • 이때, ATT와 ATU의 효과 차이에 대한 bias를 Differential Treatment Effect bias 라고 한다
  • 즉, 정말로 관측된 효과가 ATE가 되려면 이 두 bias가 모두 0이 되어야 한다.
    • Differential Treatment Effect Bias가 0이 되려면? (1-pi)는 0이 될 수 없다.
    • ATT = ATU가 같아야만 한다.
    • 즉, control 과 treatment 그룹의 특성이 매우 유사해서 인과적인 효과가 같을 때에만 ATT=ATE=ATU가 될 수 있다.
    • =Exchangeability = Ceteris Paribus (=RCT에서의 효과)


그럼 ATT 자체로는 의미가 없을까?

  • 할인쿠폰이 매출 증대에 미치는 효과를 알고자 한다. 이때 쿠폰을 받은 그룹이 처치 그룹이 된다.
  • 이때 인과효과를 구한다고 하여 ATT를 구한다고 하더라도, Control group에 쿠폰을 제공한다면? 그렇지 않을 가능성이 높다.
    • 왜? Control group은 쿠폰에 대한 반응성이 낮을 것이기 때문에
  • 따라서 ATE <> ATT일 것이다. 그럼에도, 회사 입장에서는 ATE가 필요하지 않을 수 있다.
    • 왜? 쿠폰에 대한 반응성이 높은 유저에 대한 효과인 ATT만 알아도 충분할 수 있다


정리하면 다음과 같다.

  • 우리가 인과효과를 추정할 때 얻는 효과는 ATT이다.
  • 실제로 추정하고자 하는 효과가 ATT인지 ATE인지 확실히 할 필요가 있다.
  • ATE를 추정하고자 한다면, Ceteris Paribus를 만족해야 한다.
    • 이 때에만, ATT=ATU=ATE


3. 참고 자료