왜 요즘 관찰연구는 Target Trial이라는 언어를 먼저 말할까

관찰연구를 오래 보다 보면, 어느 순간부터 논문 제목과 본문 초반에 같은 표현이 반복해서 등장하는 걸 보게 됩니다.

Target trial emulation.

처음에는 이걸 하나의 유행어처럼 받아들이기 쉽습니다. 예전에는 propensity score matching이 자주 보였고, 어느 시기에는 machine learning adjustment가 유행처럼 보였듯이, 이번에는 target trial이 새로 떠오른 방법론 키워드처럼 보일 수 있습니다.

하지만 제가 느끼기에는 이건 단순한 유행이 아닙니다. 통계기법의 교체라기보다, 연구 질문을 쓰는 방식 자체가 바뀌고 있다는 신호에 가깝습니다.

예전의 관찰연구는 데이터와 모델을 먼저 설명했다

오랫동안 관찰연구는 이런 식으로 설명되는 경우가 많았습니다.

어떤 데이터베이스를 썼는가
어떤 환자들을 포함했는가
어떤 회귀모형을 썼는가
propensity score를 어떻게 계산했는가

즉 "무엇을 가지고 어떻게 분석했는가"가 설명의 중심이었습니다. 물론 그 자체로 중요한 정보입니다. 하지만 이 구조만으로는 독자가 가장 먼저 물어야 할 질문이 남습니다.

"이 연구는 도대체 어떤 임상시험을 대신하려는 것인가?"

관찰자료는 RCT처럼 무작위 배정도 없고, 치료 시작 시점도 지저분하고, 비교군도 자연스럽게 주어지지 않습니다. 그런데도 연구 결과만 보면 마치 임상시험처럼 해석하고 싶어집니다. 이 간극을 그냥 두면, 결과는 있어도 질문은 흐려지게 됩니다.

Target Trial이라는 언어는 질문을 먼저 쓰게 만든다

Target trial emulation이 중요한 이유는 단순히 새로운 분석법이라서가 아닙니다. 오히려 핵심은 분석 이전에 질문을 더 엄격하게 쓰게 만든다는 데 있습니다.

TTE를 제대로 쓰려면 최소한 이런 요소들을 먼저 적어야 합니다.

누가 연구에 들어오는가
어떤 치료 전략을 비교하는가
comparator는 무엇인가
추적은 언제부터 시작하는가
결과는 무엇인가
어떤 causal contrast를 말하려는가
분석 계획은 무엇인가

즉 관찰연구를 하기 전에 "내가 진짜 임상시험을 할 수 있었다면 어떻게 설계했을까?"를 먼저 써야 합니다. 이 질문이 들어오는 순간부터 연구의 결이 달라집니다.

예전에는 결과표를 보고 나서 해석을 고민했다면, 이제는 설계 문장을 읽는 순간부터 이 연구가 얼마나 정직한지 보이기 시작합니다.

왜 이 언어가 지금 더 중요해졌을까

제가 보기에는 이유가 몇 가지 있습니다.

첫째, 관찰연구를 보는 눈이 전체적으로 더 엄격해졌습니다. 이제는 단순히 "RWD를 썼다", "보정을 했다", "민감도 분석도 했다"는 말만으로는 충분하지 않습니다. time zero가 맞는지, comparator가 공정한지, 신규사용자 설계인지, intercurrent event를 어떻게 다루는지가 더 많이 묻힙니다.

둘째, 규제기관과 방법론 문헌이 같은 방향을 가리키기 시작했습니다. 최근 문서들을 보면 직접 "target trial"이라는 단어를 쓰지 않더라도, 그 정신에 가까운 질문들을 반복합니다. 연구 질문의 명확성, 설계 정당성, data relevance/reliability, bias control을 계속 묻고 있습니다.

셋째, 결과의 재현 가능성과 설명 가능성에 대한 요구가 커졌습니다. 관찰연구는 본질적으로 복잡합니다. 그렇기 때문에 결과보다 설계를 먼저 명료하게 쓰는 프레임이 더 필요해졌습니다.

TTE는 회귀모형의 대체물이 아니다

여기서 자주 생기는 오해가 하나 있습니다. target trial emulation을 어떤 특정 통계기법으로 이해하는 경우입니다.

하지만 TTE는 회귀나 weighting의 대체물이 아니라 설계 프레임입니다.

다시 말해, - target trial은 질문을 쓰는 방식이고 - propensity score, IPW, g-methods 등은 그 질문을 추정하기 위한 도구입니다

이 순서가 뒤집히면 곤란합니다. 분석 기법부터 정해놓고 나중에 target trial처럼 포장하는 순간, TTE는 외형만 남고 실질은 약해집니다.

실제 논문을 읽을 때도 이 차이를 느끼게 됩니다. 좋은 TTE 논문은 methods 초반에 연구가 흉내 내려는 임상시험의 구조를 분명하게 적습니다. 반대로 약한 논문은 통계적 조정 설명은 길지만, target trial이 무엇인지 불분명합니다.

이 언어를 익히면 연구를 보는 눈이 달라진다

제가 target trial이라는 언어가 중요한 이유를 다시 말하자면, 이 프레임을 익히는 순간 논문 읽는 순서 자체가 바뀌기 때문입니다.

예전에는 결과표, hazard ratio, p-value를 먼저 봤다면, 이제는 이런 질문부터 하게 됩니다.

이 연구는 누가 언제 entry 했는가
treatment assignment는 어떻게 이해해야 하는가
comparator는 진짜 임상적으로 대체 가능한가
follow-up 시작이 양쪽에서 같은 규칙으로 정의됐는가
intention-to-treat에 가까운가, per-protocol에 가까운가

이런 질문은 단순히 target trial 논문에만 적용되는 게 아닙니다. 관찰연구 전반을 읽는 기준이 됩니다. 그리고 그 기준이 생기면 "통계는 복잡한데 왠지 불안한 논문"과 "설계가 정직해서 믿을 수 있는 논문"을 조금 더 빨리 구분하게 됩니다.

결국 바뀌는 것은 방법론이 아니라 태도다

그래서 저는 요즘 관찰연구에서 target trial이라는 언어가 자주 등장하는 현상을 반갑게 봅니다. 이건 단순한 트렌드가 아니라, 관찰연구를 조금 더 정직하게 쓰려는 압력이 커졌다는 뜻으로 읽히기 때문입니다.

결국 중요한 건 target trial이라는 말을 썼느냐가 아닙니다. 그 말을 쓰면서도 정말로 질문을 먼저 정교하게 썼느냐입니다.

관찰연구는 본질적으로 현실의 지저분함을 다뤄야 합니다. 그래서 더더욱 질문을 명시적으로 쓰는 태도가 중요합니다. target trial이라는 언어는 그 태도를 강제하는 좋은 프레임이라고 생각합니다.