RWE는 왜 항상 뭔가 찜찜한 결론으로 끝나는가

RWE(Real-World Evidence) 분석 프로젝트가 마무리될 즈음이면, 회의실에서는 묘하게 비슷한 장면이 반복되곤 합니다.

"통계적으로는 유의하게 나왔습니다. 민감도 분석 결과도 일관적입니다."

분명 수치는 기준을 넘었고, 프로토콜에 따라 분석도 수행되었습니다. 하지만 박수치며 끝나는 경우는 드뭅니다. 대신 잠시 침묵이 흐르고, 누군가 조심스럽게 말을 꺼냅니다.

"그런데... 뭔가 좀 찜찜하지 않나요?"

그때부터 범인 찾기가 시작됩니다. 누군가는 데이터 품질을 문제 삼고, 누군가는 모형이 너무 단순했던 것은 아닌지, 혹은 더 복잡한 머신러닝 기법을 사용했어야 했던 것은 아닌지 되묻습니다.

하지만 분명히 말씀드릴 수 있는 점은, RWE가 종종 이런 식으로 끝나는 이유가 분석이 부족해서도, 데이터가 지저분해서도 아니라는 것입니다.

문제는 그보다 훨씬 앞단에 있습니다. 우리가 RWE에게 어떤 질문을 던졌는가에 있습니다.

1. 우리는 왜 RWE에게 RCT의 답을 요구할까

RWE를 설계할 때 연구자나 의사결정자들이 가장 자주 던지는 질문은 대개 이런 형태입니다.

이 약이 정말 효과가 있나요?
이 결과를 근거로 처방을 바꿔도 안전한가요?
확실하게 결론을 내려주실 수 있나요?

얼핏 보면 모두 합리적인 질문처럼 보입니다. 하지만 조금만 들여다보면, 이 질문들은 RCT에 훨씬 더 잘 어울립니다.

RCT는 처음부터 질문이 명확히 정의된 세계입니다. 누구에게, 언제, 무엇을, 어떻게 투여할지, 그리고 그 결과를 어떤 기준으로 비교할 것인지가 사전에 통제됩니다.

반면 RWE는 질문을 설계하는 연구라기보다, 이미 벌어진 현실을 해석하는 연구에 가깝습니다.

혼돈스러운 의료 현장에서 생성된 데이터를 바탕으로, 사후적으로 인과관계를 추론해야 하는 작업이기 때문입니다. 그럼에도 불구하고 우리는 종종 RWE에게 RCT와 같은 통제된 확신을 기대합니다. 태생적으로 대답할 수 없는 질문에 답을 요구하는 순간, 결과가 찜찜해지는 것은 어쩌면 자연스러운 일인지도 모르겠습니다.

2. 찜찜함의 정체는 통계가 아닙니다

RWE 결과가 불편할 때, 많은 분들은 먼저 통계를 떠올립니다.

공변량 조정이 부족했던 것은 아닐까?
propensity score 매칭이 잘 이루어지지 않은 것은 아닐까?
time-varying confounding을 놓친 것은 아닐까?

물론 이러한 기술적 요소들은 매우 중요합니다. 하지만 현장에서 느끼는 본질적인 찜찜함은 통계 그 이전, 정의의 문제에서 비롯되는 경우가 많습니다.

이 환자가 받은 처방은 정말 우리가 의도한 치료였을까?
우리가 설정한 시작점은 임상적으로 타당했을까?
기록되지 않은 의사의 판단, 즉 관측되지 않은 교란이 개입되지는 않았을까?

이 질문들에 명확히 답하지 못한다면, 아무리 정교한 통계 기법을 적용하더라도 결론은 쉽게 선명해지지 않습니다. 이는 수식의 문제가 아니라, 현실을 데이터로 번역하는 과정에서 발생하는 구조적 한계이기 때문입니다.

3. 시간(Time)은 RWE를 가장 어렵게 만든다

RWE의 복잡성은 결국 시간의 문제로 귀결되는 경우가 많습니다. 현실의 의료 데이터에서 시간은 RCT처럼 깔끔하게 정렬되어 있지 않습니다. 처방일과 실제 복용일은 다를 수 있고, 진단일과 실제 질병 발병 시점 역시 일치하지 않는 경우가 많습니다. 의료 이용 행태는 환자의 상태뿐 아니라 보험 급여 정책이나 병원의 사정에 따라 끊임없이 변합니다.

우리는 분석을 위해 이 복잡한 시간 구조를 단순화합니다. "이 시점을 시작점(T0)으로 보자"고 정의하는 순간, 현실의 많은 디테일은 분석의 범위 밖으로 밀려나게 됩니다. 그 단순화의 대가가 바로 "결과가 맞는 것 같긴 한데..."라는 감각입니다.

복잡한 현실을 하나의 추정치로 압축했기 때문에, 무언가 빠져 있다는 느낌이 남는 것은 어쩌면 당연한 일입니다.

4. RWE는 답보다 질문에 가깝다

그래서 저는 RWE 결과를 검토할 때, 결과표보다 먼저 이 연구가 던지고 있는 질문을 다시 읽어보려고 합니다.

이 연구는 정확히 무엇을 묻고 있을까?
이 데이터로 대답할 수 있는 범위는 어디까지일까?
우리가 말하지 않기로 한 가정은 무엇일까?

이 지점에서 RMP의 철학은 많은 시사점을 줍니다. RMP는 단정적인 결론을 요구하지 않습니다. 대신 질문을 나열합니다.

어떤 위험이 우려되는가?
우리가 알고 있는 것은 무엇이고, 아직 모르는 것은 무엇인가?
그 부족한 정보를 채우기 위해 어떤 접근이 필요한가?

RWE 역시 이런 관점에서 읽힐 필요가 있습니다. 확신을 주는 연구라기보다, 확신의 범위를 정의하는 연구로 받아들여져야 합니다.

5. 좋은 RWE는 깔끔하지 않다

역설적으로, 좋은 RWE 연구는 종종 불편합니다. 결론은 단정적이지 않고, 여러 조건과 단서가 함께 따라붙습니다.

"A 조건에서는 효과가 관찰되지만, B 집단에서는 해석에 주의가 필요합니다."

이러한 불편함은 연구의 실패가 아닙니다. 오히려 현실에 더 가까이 다가갔다는 신호라고 생각합니다.

RWE의 역할은 "이 약은 된다/안 된다"라고 판결을 내리는 것이 아니라, "이 복잡한 현실 속에서는 이렇게 관찰됩니다"라고 말하는 데 있습니다.

그래서 저는 RWE 결과를 볼 때 "이 연구가 맞는가"보다 "이 연구가 솔직한가"를 먼저 보려고 합니다. 좋은 RWE란 억지스러운 확신을 주는 연구가 아니라, 우리가 어디까지 확신할 수 있는지를 정확하게 말해주는 연구이기 때문입니다.