앤트로픽, 중급 모델서도 ‘최상위급 성능’…소네트 4.6 전격 공개 |

코딩·엑셀·재무 분석까지 전방위 강화
일부 벤치마크서 오퍼스 4.6 능가
저가 모델 고성능화에 ‘사스포칼립스’ 우려 재점화

다리오 아모데이 앤트로픽 최고경영자(CEO)의 모습. 블랙스톤은 앤트로픽이 진행중인 이번 투자 라운드에 2억달러 규모로 참여할 계획이다.[게티이미지]

[헤럴드경제=서지연 기자] 인공지능(AI) 챗봇 ‘클로드’를 운영하는 앤트로픽이 중급 주력 모델인 ‘소네트’의 성능을 대폭 끌어올린 신규 모델을 공개했다. 최상위 모델 ‘오퍼스’에 이어 중급 모델에서도 최고 수준의 성능을 구현하면서, AI 확산에 따른 소프트웨어 산업 구조 변화 우려가 다시 커지고 있다.

앤트로픽은 17일(현지시간) 신규 AI 모델 ‘클로드 소네트 4.6’을 출시했다고 밝혔다. 지난 5일 ‘오퍼스 4.6’을 선보인 지 약 2주 만이다. 회사는 이번 업데이트를 통해 코딩, 컴퓨터 활용, 추론, 에이전트 기능 등 전반적인 AI 역량을 강화했다고 설명했다.

성능 지표를 보면 소네트 4.6은 중급 모델임에도 상당수 평가에서 오퍼스 4.6에 근접하거나 일부 항목에서는 오히려 앞섰다. 코딩 능력을 평가하는 ‘SWE-벤치 베리파이드’ 점수는 79.6%로, 오퍼스 4.6의 80.8%에 거의 근접했다. 컴퓨터 제어 기반 AI 에이전트 성능을 측정하는 ‘OS월드-베리파이드’ 점수도 소네트 4.6이 72.5%를 기록해 오퍼스 4.6(72.7%)과 큰 차이를 보이지 않았다.

재무 분석 역량에서는 소네트 4.6이 오히려 상위 모델을 앞섰다. ‘파이낸셜 에이전트 v1.1’ 지표에서 소네트 4.6은 63.3%를 기록해 오퍼스 4.6의 60.1%를 웃돌았다. 엑셀 등 사무업무 수행 능력을 평가하는 ‘GDPval-AA Elo’ 점수 역시 소네트 4.6이 1633점으로 오퍼스 4.6의 1606점보다 높았다.

앤트로픽은 기업 고객을 겨냥해 소네트 4.6의 처리 용량도 크게 늘렸다. 한 번에 입력·처리할 수 있는 정보량을 100만 토큰으로 확장해 대규모 문서와 데이터 분석 작업에 유리하도록 했다. 토큰은 생성형 AI가 처리하는 데이터 단위로, 영어 기준 1토큰은 단어 1개 안팎이다. 기업용 가격은 기존과 동일하게 100만 토큰당 3∼15달러로 유지했다.

이번 업데이트는 최근 업계에서 거론되는 ‘사스포칼립스’ 논란을 다시 자극할 가능성이 크다는 평가다. 고성능 AI 기능이 상대적으로 저렴한 모델까지 내려오면서, 기존 소프트웨어 서비스(SaaS) 기업들의 경쟁력이 급속히 약화될 수 있다는 우려다. 앤트로픽이 최근 선보인 ‘클로드 코워크’ 등 업무 자동화 도구 역시 이런 논쟁에 불을 붙였다.