[김길원의 헬스노트] 활용도 커지는 'AI 건강검진'…"장밋빛 환상은 경계해야"

(서울=연합뉴스) 김길원 기자 = 최근 국내 건강검진 현장의 가장 뜨거운 화두는 인공지능(AI)이다. "AI가 10초 만에 폐암을 찾아냈다", "피부암 진단 정확도가 의사를 능가한다"는 등의 평가가 쏟아지며, 이제 AI가 인간 의사를 대신해 모든 질병을 완벽히 잡아낼 수 있다는 기대감이 커지고 있다.
하지만 한편에서는 화려한 수식어 뒤에 숨겨진 진실을 제대로 들여다봐야 한다는 경고의 목소리도 만만찮다.
한국의학바이오기자협회(회장 민태원)가 지난 15일 서울 중구 한국프레스센터에서 개최한 '의료 패러다임의 대전환, AI 건강검진의 현재와 미래' 심포지엄은 이런 AI 검진의 현주소와 명암을 동시에 짚어보는 자리였다.
이날 기조 강연을 맡은 강대희 서울의대 예방의학교실 교수는 AI가 미래 의료의 핵심인 '4P(예방·예측·맞춤·참여)'를 실현할 핵심 도구라고 강조했다.
검진 전에는 고위험군을 발굴해 항목을 최적화하고, 검진 중에는 판독 편차를 줄이며, 검진 후에는 맞춤형 행동 지침을 제공하는 식이다.
강 교수는 "미래의 AI 검진은 단발성 검사에서 벗어나 지속적인 '구독형 건강관리' 체계로 전환될 것"이라며 AI 검진 제도의 정착이 K-메디슨(K-Medicine)의 세계화에도 필수적이라고 제언했다.
실제 현장의 변화도 눈부시다.
안지현 한국의학연구소(KMI) 수석상임연구위원은 대장내시경 병변 누락 방지나 안저 사진을 활용한 심혈관질환 위험 예측 등 AI가 접목된 실제 임상 사례를 공유했다.
특히 안저 촬영을 통한 심혈관질환 예측은 추가적인 방사선 노출 없이 '기회 검진'(Opportunistic Screening)의 효용성을 극대화한다는 점에서 활용도가 높다는 게 안 연구위원의 설명이다.
그는 "AI와 의료진의 협업은 의료진의 번아웃을 막고 수검자에게 정밀한 '인간 중심 의료'를 제공하는 상생 모델이 될 것"이라고 내다봤다.

그러나 이 같은 '장밋빛 전망' 뒤에는 반드시 짚고 넘어가야 할 함정이 있다.
김형진 삼성서울병원 국제진료센터 교수는 "가장 흔한 오해는 AI의 '높은 정확도'로, 흔히 홍보되는 90% 이상의 정확도는 대부분 최적화된 '논문 속 숫자'일 가능성이 크다"며 맹목적인 기대를 정면으로 비판했다.
임상 현장에서는 병원마다 장비와 촬영 프로토콜이 다르고, 환자군의 특성도 제각각이어서 일률적으로 높은 정확도를 기대하기는 어렵다는 것이다.
한 메타 분석에 따르면 실험실에서 92%였던 정확도가 실제 현장에서 52.1%까지 급락한 사례도 있다. 숫자에 안심하기보다 실제 한국인 환자를 대상으로 효과가 검증됐는지를 먼저 물어야 하는 이유다.
정부도 국가건강검진에 AI를 도입하는 것은 아직 이르다는 입장이다.
정혜은 보건복지부 건강증진과장은 "AI 기술을 국가검진에 활용하려면 지금까지 축적된 근거 수준 등에 대한 검증 과정을 더 거쳐야 한다"고 말했다.
AI 결과표의 '이상 소견'을 확정된 진단으로 오해해서도 안 된다. AI가 제시하는 결과는 진단이 아닌 추가 확인이 필요한 '신호'(flagging)에 가깝기 때문에 이를 진단으로 오해할 경우 불필요한 검사와 침습적 시술로 이어질 수 있기 때문이다.
이 중에서도 위양성(가짜 양성)의 위험을 경계해야 한다는 게 김 교수의 지적이다. 저선량 폐 CT(컴퓨터단층촬영)의 경우 위양성률이 최대 49.3%에 달한다는 보고도 있다.
김 교수는 "AI는 학습 데이터의 편향을 그대로 반영하고, 대규모 데이터라고 해서 공정성을 보장하지는 않는다"면서 "미국식품의약국(FDA) 및 식약처 허가 역시 최소 안전 기준일 뿐 임상적 유효성을 충분히 검증한 것은 아니다"라고 말했다.
이어 "AI 건강검진을 불신할 필요는 없지만, 그 결과를 비판적으로 해석하고 질문을 던져야 안전한 의료로 이어진다"며, "AI 시대에 중요한 것은 더 나은 기술이 아니라 더 나은 질문"이라고 강조했다.
bio@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>