실제 진료 데이터를 다루다 보면 이런 결과를 너무나 자주 봅니다.
"약을 꾸준히 먹은 사람은 예후가 좋습니다."
특히 순응도(adherence) 연구에서는 거의 자연법칙처럼 등장하는 결과죠. 하지만 역학자나 데이터 분석가의 머릿속에는 자동으로 삐딱한 질문이 따라옵니다.
"그게 약을 꾸준히 먹어서 좋아진 걸까? 아니면 원래 건강한 사람이니까 약도 꼼꼼하게 챙겨 먹은 걸까?"
오늘은 이 인과관계의 미로를 탈출하기 위한 실무적인 도구인 Clone-Censor-Weight(CCW)를 정리해보려 합니다. 그리고 더 나아가, 우리가 왜 이상(per-protocol)과 현실(as-treated)이라는 두 가지 안경을 동시에 써야 하는지도 이야기해 보겠습니다.
1. 순응도 연구가 어려운 이유: 꾸준함은 랜덤이 아니다
순응도는 단순한 노출이 아니라 시간에 따라 바뀌는 행동입니다. 그리고 그 행동은 환자의 건강 상태와 복잡하게 얽혀 있습니다.
- 상태 악화: 입원하거나 합병증이 생기면 약을 끊거나 바꾸는 경우가 늘고
- 부작용: 몸이 힘들면 약을 중단하고
- 건강한 습관: 상태가 안정적이고 생활이 규칙적인 사람일수록 꾸준히 복용할 가능성이 높습니다
현실 데이터에서 흔히 하는 "12개월 유지군 vs 중단군" 비교는 사실상 치료 효과의 비교라기보다, 건강하고 성실한 사람 vs 아프고 힘든 사람의 비교가 되기 쉽습니다.
2. CCW 한 줄 정의: 복제하고, 자르고, 되돌린다
이 함정을 피하기 위해 등장한 Clone-Censor-Weight는 관찰자료에서 "특정 치료 전략을 지켰다면 결과는 어땠을까?"를 추정하는 방법입니다. 핵심은 세 단어입니다.
- Clone: 한 사람을 여러 전략에 가상으로 복제해 배정하고
- Censor: 각 전략을 위반하는 순간 그 복제본을 검열하며
- Weight: 그 검열이 랜덤이 아니기 때문에 생긴 편향을 가중치(IPW)로 보정한다
말은 거창하지만 발상은 단순합니다.
"현실에서 사람들은 전략을 자주 어긴다. 그 위반을 censor로 처리하되, 더 아픈 사람이 더 많이 끊는 경향이 있으니 가중치로 균형을 맞춰 주자."
3. 왜 두 가지 안경(As-Treated, Per-Protocol)을 모두 써야 할까
CCW로 산출한 per-protocol 효과는 우리가 도달하고 싶은 이상적 목표에 가깝습니다. 하지만 분석할 때 전통적인 as-treated 결과도 함께 테이블에 올립니다. 왜 굳이 두 번 일을 할까요?
첫째, 질문의 결이 다르기 때문입니다.
- Per-protocol: 환자가 치료 전략을 지켰다고 가정하면, 결과는 어떻게 달라질까?
- As-treated: 현실에서 환자들이 약을 먹다 끊다 하면서 관찰된 결과는 어땠을까?
우리는 약의 잠재력도 알아야 하고, 현실에서의 성적표도 봐야 합니다. 다만 as-treated는 현실에서 관찰된 결과이지, 그 자체가 자동으로 편향 없는 현실 효과는 아니라는 점은 늘 염두에 둬야 합니다.
둘째, 비뚤림을 감지하는 리트머스 종이가 되기 때문입니다.
만약 as-treated 분석에서는 약 효과가 20% 좋아 보였는데, 정교하게 보정한 CCW 분석에서는 5%밖에 안 좋아졌다면? 이 차이가 곧 순응도 편향의 후보입니다. 두 결과의 차이가 클수록, 그 데이터에는 우리가 충분히 측정하지 못한 교란요인이 숨어 있을 가능성이 큽니다.
4. CCW가 예쁘게 안 나올 때: 실무의 함정들
이론은 완벽해 보이지만 현실 데이터에서는 자주 무너집니다.
- 전략 정의의 모호함: grace period나 switching 정의가 분석가의 자의적 선택처럼 보이면 안 됩니다. 사전에 프로토콜로 못 박아야 합니다.
- 가중치 폭발: 특정 집단이 약을 무조건 끊거나, 반대로 무조건 먹는 상황이면 가중치가 비정상적으로 커집니다.
- 교란요인 누락: "상태 악화 -> 중단"이 핵심인데, 상태 악화의 신호를 모델에 반영하지 못하면 편향이 남습니다.
5. 데이터로 진실을 번역하는 법
결국 좋은 분석가는 "이것이 정답이다"라는 숫자 하나만 던지는 사람이 아닙니다.
"현실은 이러했고, 편향을 걷어낸 가정하의 결과는 이렇습니다. 그 차이는 환자들의 행동 패턴과 데이터 구조에서 기인합니다."
이렇게 맥락까지 설명해 주는 사람이 더 좋은 분석가라고 생각합니다. CCW는 지저분한 현실 데이터를 전략 비교의 언어로 번역하기 위한 강력한 도구 중 하나입니다.