구글, 제미나이 1.5프로 공개…“전작보다 언어 등 87% 향상”

구글 제미나이 1.5가 40분 분량의 영화 줄거리를 요약하는 모습. [구글 제공]

[헤럴드경제=고재우 기자] 구글이 멀티모달 인공지능(AI) 모델 ‘제미나이 1.5프로’를 공개했다.

멀티모달은 텍스트·이미지·음성·영상 등 여러 정보를 이해하고 처리하는 것으로, 제미나이 1.5프로는 전작인 제미나이 1.0 대비 AI 모델, 인프라 등 모든 부문에서 성능이 향상된 것으로 알려졌다. 특히 언어 등 다양한 분야에서 기존보다 87% 향상된 성능을 선보였다.

구글은 개발자 등을 대상으로 제미나이 1.5프로 등 초기 테스트 버전을 제공할 예정이다.

14일(미국 현지시간) 구글에 따르면 회사는 이날 제미나이 1.5프로를 공개하고, 일부 개발자 및 기업 등을 대상으로 초기 테스트 프리뷰 버전을 제공한다.

제미나이 1.5프로는 전작보다 다양한 분야에서 성능이 향상된 것으로 나타났다. 우선 언어, 코드, 이미지, 오디오, 비디오 등 평가 영역에서 이전 모델인 제미나이 1.0프로보다 87% 나아진 모습을 보였다.

동시 연산 능력 확대를 통한 높은 수준의 정보 처리 능력은 물론, 방대한 텍스트에서 특정 정보를 찾아내는 AI 모델 벤치마크인(needle in haystack)에서는 100만 토큰이나 되는 테스트 블록에서 특정 정보를 99% 정확도로 찾아냈다.

특히 방대한 양의 정보를 기반으로 세부 정보를 추론할 수도 있는데, 예를 들어 402페이지 분량의 아폴로11호 달 탐사 임무 관련 문서가 주어지면 대화, 이벤트, 이미지, 세부 정보를 추론하는 식이다.

또 미국 배우 버스터 키튼의 무성 영화를 보여주면 영화 구성과 사건 등을 분석하고, 놓치기 쉬운 세부 내용까지도 파악한다는 게 구글의 설명이다.

구글의 기술에 전문가 신경망 집합을 결합한(MoE) 설계를 기반으로 개발된 제미나이 1.5프로는 복잡한 작업의 속도를 높이고, 품질은 유지하면서 학습 능력과 답변 제공 능력을 크게 높였다. 이 결과, 구글은 이전보다 빠르게 AI 모델을 반복, 훈련할 수 있게 됐다.

구글은 제미나이 1.5프로를 포함한 전(全) 모델의 초기 테스트 프리뷰 버전을 일부 개발자와 기업 고객들에 제공할 예정이다. 개발자는 구글 AI스튜디오, 기업은 구글 클라우드 버텍스 AI 담당팀에 문의하면 된다.

초기 버전 이용자들은 테스트 기간 동안 100만 토큰의 콘텍스트 윈도우(한번에 처리할 수 있는 정보의 양)를 무료로 사용할 수 있다. 단, 실험적인 기능인 만큼 대기 시간 및 속도가 지연될 수 있다.

향후 정식 버전으로 기본 12만8000 토큰의 콘텍스트 윈도우를 갖춘 제미나이 1.5 프로가 제공될 예정인데, 구글은 가까운 시일 내 콘텍스트 윈도우 확장에 따른 단계별 구매 옵션을 공개할 계획이다.

한편, 제미나이 1.5 기술 보고서는 구글 내 홈페이지에서 확인할 수 있다.

Print Friendly