“이러면 의사한테 진료 안 받는다” 충격적인 결과에 ‘발칵’ |

[게티이미지뱅크]

[헤럴드경제=고재우 기자] 산업 전 분야에서 인공지능(AI) 활용이 대세로 자리 잡은 가운데, 의료 현장에서도 AI 판단이 의료진보다 정확하다는 연구 결과가 나왔다.

단, 현재까지는 ‘의사+AI 조합’만이 가능하다. 의료법에서 의료인에 한해서만 진단 및 처방 등 의료행위를 할 수 있도록 규정하고 있기 때문이다.

용인세브란스병원 전경. [용인세브란스병원 제공]

용인세브란스병원에 따르면 배성아 심장내과·박진영 정신건강의학과 교수, 연세의대 본과 4학년 정재원·김현재 학생 등으로 구성된 연구팀은 이 같은 연구 결과를 발표했다.

해당 연구는 오픈AI 멀티모달(기계 입출력에 텍스트, 음향, 이미지 등 다양한 정보를 사용하는 것) 및 추론 AI 모델(GPT-4o, o1)의 임상 판단 정확도를 의료진 응답과 비교하는 방식으로 진행됐다. 지난 2011년부터 2024년까지 의료 교육 플랫폼 ‘메드스케이프’에 공개된 1426건의 임상 증례를 분석한 결과다.

각 증례에는 환자의 상세한 병력, 신체검사 소견, 혈액 검사 결과는 물론 X-ray(엑스레이), CT, MRI, 초음파, 심전도, 병리 슬라이드 등 총 917건의 의료 영상이 포함됐다. 실제 임상에서 접하는 복잡한 진단 상황을 반영하기 위함이다.

연구 결과, 다수 의료진이 선택한 답안 정확도는 85%였으나, GPT-4o는 이보다 높은 88.4%였다. 최신 추론 모델인 o1은 무려 94.3% 정확도를 기록했다. 두 모델 모두 의료진보다 높은 정확도를 보인 것이다.

세부적으로 o1 모델은 진단(92.6%), 질병 특성 파악(97.0%), 검사 계획(92.6%), 치료 방향 설정(94.8%) 등 모든 임상 판단 영역에서 90% 이상 정확도를 유지했다. 또 내과외과정신과 등 전공 분야와 관계없이 안정적인 성능을 나타냈다.

이와 함께 연구팀은 동일한 증례를 5회 반복 분석해 AI 모델의 판단 일관성도 검증했다. GPT-4o는 86.2%의 증례에서, o1은 90.7%의 증례에서 ‘모두’ 정확한 답을 제시했다. 이는 AI 모델이 단순한 우연이나 무작위 선택이 아닌 체계적인 추론을 바탕으로 답을 도출하고 있다는 것을 보여주는 결과라는 게 연구팀 설명이다.

[게티이미지뱅크]

하지만 국내 의료법상 AI는 의사를 보조하는 수단으로만 쓰일 수 있다. 의료법은 ▷의료인이 아니면 누구든지 의료행위를 할 수 없고 ▷의료인도 면허 이외의 의료행위를 할 수 없다고 규정하고 있다.

조진석 법무법인 오킴스 변호사는 “의료에서도 AI에 대한 정확성이 확인되고, 접근성도 커지지만, 의료행위는 의사, 치과의사, 한의사 등 의료인이 해야 한다”며 “현재로서 AI는 보조적으로 활용할 수 있는 도구 역할”이라고 말했다.

이어 “전적으로 의사가 아닌 자가 AI를 가지고 진단 및 처방 등 의료행위를 하면 명백한 무면허 의료행위가 될 수 있다”고 경고했다.