구글 ‘추론·학습’에 특화된 8세대 AI칩 공개…기업용 ‘AI에이전트 플랫폼’도 선봬 |

연례 기술 콘퍼런스 ‘구글 클라우드 넥스트 2026’
연내 8세대 AI칩 정식 버전 출시…“이전 세대 대비 달러 당 성능 80% 향상”
기업용 AI 플랫폼도 선봬…“200개 이상 AI 모델 자유롭게 활용”

토마스 쿠리안 구글 클라우드 최고경영자(CEO)가 22일(현지시간) 미국 라스베이거스에서 열린 연례 기술 콘퍼런스 ‘구글 클라우드 넥스트 2026(Google Cloud Next ’26)’에서 신규 서비스를 소개하고 있다. [온라인 생중계 갈무리]

[헤럴드경제=박세정 기자] 구글이 학습과 추론에 특화된 8세대 인공지능(AI) 칩을 공개하고 엔비디아가 독점하는 AI칩 시장에 도전장을 내밀었다.

이와 함께 기업용 AI 에이전트 플랫폼을 선보이고 B2B(기업고객) 시장도 정조준했다.

구글은 22일(현지시간) 미국 라스베이거스에서 열린 연례 기술 콘퍼런스 ‘구글 클라우드 넥스트 2026(Google Cloud Next ’26)’에서 이같은 신규 서비스를 대거 선보였다.

우선, 구글 클라우드는 학습과 추론에 각각 최적화된 구글의 8세대 맞춤형 텐서 프로세서 유닛(TPU), ‘TPU 8t’와 ‘TPU 8i’를 공개했다.

‘TPU 8t’는 학습에 초점을 맞춘 칩이다. 높은 연산 처리량과 공유 고대역폭메모리(HBM) 등을 활용해 전작인 7세대 ‘아이언우드’와 비교해 처리 능력을 3배로 끌어올렸다.

칩 간 연결(ICI) 기술을 활용해 칩을 최대 9600개까지, 대역폭 메모리(HBM) 용량을 최대 2PB(페타바이트))까지 확장해 훈련 성능과 속도를 높일 수 있다. 구글은 이 칩을 활용하면 최첨단 프런티어 모델(frontier model) 개발 기간을 수개월에서 수주 단위로 단축할 수 있다고 강조했다.

‘TPU 8i’는 추론 엔진이다. 에이전트에게 질문을 던지거나 업무를 시켰을 때, 5초씩 기다릴 필요 없이 즉각적인 응답을 제공하는 것이 특징이다. 이전 세대보다 3배 이상 늘어난 384MB의 온칩(on-chip) SRAM과 288GB의 HBM를 탑재했다.

구글은 8세대 TPU는 이전 세대 대비 달러당 성능을 80% 향상시켰다고 설명했다. 두 칩은 연내 정식 버전(GA)이 출시될 예정이다.

이와 함께 구글은 기업이 AI 에이전트를 구축확장하고 최적화할 수 있는 ‘제미나이 엔터프라이즈 에이전트 플랫폼’을 선보였다.

이 플랫폼은 기존의 AI 개발 플랫폼인 ‘버텍스 AI’가 진화한 형태로, AI 에이전트를 만들고 확장·관리·최적화할 수 있는 단일 창구를 제공한다.

기업은 모델 가든(Model Garden)을 통해 200개 이상의 AI 모델을 자유롭게 활용할 수 있다. 구글의 제미나이 3.1 프로, 제미나이 3.1 플래시 이미지(일명 ‘나노 바나나 2’), 리리아 3(Lyria 3) 등 구글의 최신 모델이 포함된다. 앤스로픽의 클로드 오퍼스(Opus), 소네트(Sonnet), 하이쿠(Haiku) 등 타사 모델까지 지원한다. 앤스로픽의 최신 모델인 클로드 오퍼스 4.7에 대한 지원도 추가했다.

구글 로고. [게티이미지]

이외에도 보안 부문에선 구글 클라우드와 다른 클라우드를 함께 사용하는 ‘멀티클라우드’ 보안을 강화하기 위해 경쟁사인 아마존웹서비스(AWS)와 마이크로소프트(MS) ‘애저’ 등의 에이전트 도구도 지원하기로 했다.

토마스 쿠리안 구글 클라우드 CEO는 “제미나이 엔터프라이즈는 기업의 데이터와 인력, 모든 애플리케이션과 에이전트를 연결해 전체 업무 프로세스를 하나의 지능형 흐름으로 바꾸는 유기적 신경망”이라며 “모든 요소가 수직적으로 최적화된 통합 스택을 제공해 새로운 AI 상용화 시대를 선도하겠다”라고 강조했다.