<인과추론> 3. 보충) 잠재 결과 프레임워크 / 인과추론의 가정 / 편향과 ATT&ATU&ATE
30 May 2025 | 인과추론 데이터분석1. 잠재적 결과 프레임워크와 가정
Potential Outcome Framework
“Neyman-Rubin Causal Model”
- Counterfactual = 관측되지 않은 사실 = 반사실적 사실
- 이론적인 Causal effect = (Actual outcome if treated) - (Potential outcome if not treated)
- 현실에서는, 한 사람이 동시에 두 가지 상태를 관측할 수 없다. 따라서
- 관측되는 Causal effect = (Actual outcome for treated if treated) - (Actual outcome for untreated if not treated)
- 이때, 이론에서의 Potential outcome if not treated와 현실에서의 Actual outcome for untreated if not treated가 같을 수는 없다.
- 이 둘을 다르게 하는 요인을 편향(선택 편향, selection bias)라고 부르고 이 편향을 없애기 위한 과정을 식별(identification)이라고 한다.
일반적으로 전체 그룹에서 식별된 인과효과를 ATE라고 한다. 인과 추론의 고도화된 목적은, 전체에 대한 평균 처치 효과가 아닌, 개인에게의 처치 효과까지를 추론해내는 것 (=개인화)
ATE → CATE(Conditional ATE) / HTE(heterogeneous) → ITE (Individual)
PO Framework에서 인과효과를 식별하기 위한 가정들
Assumption 1. SUTVA (Stable Unit Treatment Value Assumption)
- 1-1. Counterfactual consistency
- $Y = Y(1) if T=1, Y=Y(0) if T=0$
- $T_i$를 받은 unit의 관측된 $Y_i$는 $T_i$에 대한 잠재 결과와 같다.
- 즉, 실제 관측되는 결과와 잠재 결과는 같다.
- ex) 만약 신약을 처치 받았는데 복용을 안 하거나 제대로 투여되지 않았다면 가정에 위배
- 1-2. No Interference
- 한 unit의 잠재 결과는 다른 unit의 처리 여부나 잠재 결과에 의해 영향을 받지 않아야 한다.
- = no spillover effects
- ex) A가 백신을 맞았는데 집단 면역의 효과로 함께 거주하는 B의 결과에 영향을 미쳤다.
Assumption 2. Ignorability assumption
\[Y(t)\perp T\|X, t=0,1\]- =unconfoundedness
- = selection on observables
- 주어진 X값에 대해 통제했을 때 조건부 독립임을 의미
- 사실 더 강한 NUC(No Unmeasured Confounders) Assumption이 있다. 다만 이는 현실성이 떨어지는 가정이기 때문에 weak version인 ignorability assumption으로 대체함
- = 모든 교란변수는 X에 포함되어있다는 가정
Assumption 3. Positivity
- 모든 X 값에 대해, 처치를 받을 확률은 0 이상이어야 한다.
위 가정들이 만족되어야만 인과효과를 식별할 수 있다.
2. ATT, ATU, and ATE
- ATE: ATE in the total population
- ATT: ATE in the subpopulation where T = 1
- ATU: ATE in the subpopulation where T = 0
ATE는 처치를 받은 집단과 받지 않은 집단 모두에서의 평균 처치 효과이다. 그럼 우리가 실제로 구하게 될 인과 효과는 ATE일까 ATT일까?
앞서 배운 것처럼, 추정된 효과는 아래와 같이 분해할 수 있다.
\[\underbrace{E[Y_1-Y_0\|T=1]}_{\text{ATT}} + \underbrace{\{E[Y_0\|T=1] - E[Y_0\|T=0]\}}_{\text{편향}}\]- 여기서 selection bias를 없앤다면 남는 것은 ATT 이다.
- 즉, ceteris paribus를 만족하는 control group을 활용해서 구할 수 있는 인과 효과는 ATE가 아니다!
그럼 언제 ATT가 ATE와 같아지는가?
- ATE는 ATT와 ATU의 가중 평균이다.
- $ATE = \pi ATT + (1-\pi) ATU$
- $ATT = ATT + ATE - ATE$
- $ATT = ATE + (1-\pi) (ATT- ATU)$
- 위 에서 본 인과 효과 식에 대입해보면
- Observed effect of treatment = ATT + selection bias
- = ATE + (1-pi) (ATT - ATU) + Selection bias
- 이때, ATT와 ATU의 효과 차이에 대한 bias를 Differential Treatment Effect bias 라고 한다
- Observed effect of treatment = ATT + selection bias
- 즉, 정말로 관측된 효과가 ATE가 되려면 이 두 bias가 모두 0이 되어야 한다.
- Differential Treatment Effect Bias가 0이 되려면? (1-pi)는 0이 될 수 없다.
- ATT = ATU가 같아야만 한다.
- 즉, control 과 treatment 그룹의 특성이 매우 유사해서 인과적인 효과가 같을 때에만 ATT=ATE=ATU가 될 수 있다.
- =Exchangeability = Ceteris Paribus (=RCT에서의 효과)
그럼 ATT 자체로는 의미가 없을까?
- 할인쿠폰이 매출 증대에 미치는 효과를 알고자 한다. 이때 쿠폰을 받은 그룹이 처치 그룹이 된다.
- 이때 인과효과를 구한다고 하여 ATT를 구한다고 하더라도, Control group에 쿠폰을 제공한다면? 그렇지 않을 가능성이 높다.
- 왜? Control group은 쿠폰에 대한 반응성이 낮을 것이기 때문에
- 따라서 ATE <> ATT일 것이다. 그럼에도, 회사 입장에서는 ATE가 필요하지 않을 수 있다.
- 왜? 쿠폰에 대한 반응성이 높은 유저에 대한 효과인 ATT만 알아도 충분할 수 있다
정리하면 다음과 같다.
- 우리가 인과효과를 추정할 때 얻는 효과는 ATT이다.
- 실제로 추정하고자 하는 효과가 ATT인지 ATE인지 확실히 할 필요가 있다.
- ATE를 추정하고자 한다면, Ceteris Paribus를 만족해야 한다.
- 이 때에만, ATT=ATU=ATE
3. 참고 자료
- 실무로 통하는 인과추론 with Python 서적
- Causal Inference for the Brave and True
- 인과추론의 데이터 과학
- 김재광 교수님 Causal Inference 강의