엔비디아, 에이전트 특화 개방형AI 새모델 공개…"AI 새 전환점"

(샌프란시스코=연합뉴스) 권영전 특파원 = 세계 최대 인공지능(AI) 칩 개발사 엔비디아가 에이전트 기능에 특화한 개방형(오픈소스) AI 모델을 새로 공개했다.
엔비디아는 또 AI 클라우드 기업 네비우스에 20억 달러(약 2조9천억원)를 투자했다.
엔비디아는 매개변수(파라미터) 1천200억 개 규모의 개방형 모델 '네모트론3 슈퍼'를 출시한다고 11일(현지시간) 밝혔다.
이 모델은 사람의 개입 없이 스스로 판단하고 도구를 활용해 복잡한 작업을 수행하는 'AI 에이전트'를 저비용 고효율로 구동하는 데 최적화했다.
AI 에이전트는 질문에 응답하기만 하는 일반적인 챗봇과 달리 작업 수행을 위해 여러 단계의 추론과 외부 도구 호출 등을 반복하게 된다.
매 단계 데이터와 맥락 정보를 거듭 읽고 처리해내야 하기 때문에 일반 챗봇 대비 데이터 처리량이 최대 15배 많으며, 그만큼 자원과 비용을 많이 소모하게 된다.
네모트론3 슈퍼는 필요에 따라 전체 매개변수 1천200억 개 중 최소 120억 개만 활용하는 '혼합전문가'(MoE) 구조를 적용해 낮은 비용으로 작업을 수행하도록 했다.
또 한 번에 기억할 수 있는 데이터양을 늘려 이전 작업 결과를 매번 읽어와야 하는 비효율을 막고, 에이전트가 맨 처음 지시한 내용을 잊고 엉뚱한 작업을 하는 오류도 줄였다.
엔비디아는 이 모델이 동급 최고의 정확도를 보이며, 최신 '블랙웰' 칩을 이용해 구동하면 이전 세대 '호퍼' 칩 대비 추론 속도가 최대 4배 빠르다고 설명했다.
엔비디아가 칩 개발에 그치지 않고 AI 모델까지 만들어 개방형으로 공개하는 것은 자사 그래픽처리장치(GPU)의 장악력을 높이기 위한 것으로 풀이된다.
성능이 최고 수준에 근접한 개방형 모델을 자사 GPU에 최적화해 내놓으면 고객들이 다른 AI 칩에 눈을 돌리지 않고 지속해서 자사 제품을 사용하도록 하는 이른바 '록인' 효과를 누릴 수 있기 때문이다.
젠슨 황 최고경영자(CEO)는 "개방형 모델이 AI 발전 과정에서 핵심적인 역할을 한다"며 "연구자, 스타트업, 기업은 물론 국가 단위까지 개방형 모델을 기반으로 첨단 AI 경쟁에 참여하고 있다"고 강조해온 바 있다.

엔비디아는 이날 네덜란드 암스테르담에 본사를 둔 AI 클라우드 기업 네비우스와 전략적 파트너십을 맺고 20억 달러를 투자한다고도 밝혔다.
이번 파트너십에 따라 양사는 AI 데이터센터 설계와 추론·에이전트 기술 최적화, 차세대 엔비디아 칩 조기 도입 등에서 협력하게 된다.
네비우스는 2030년 말까지 5GW(기가와트) 이상의 엔비디아 시스템을 구축하기로 했다.
황 CEO는 "AI는 새 전환점을 맞았다. 에이전트 AI가 엄청난 연산 수요를 이끌며 인프라 구축을 가속화하고 있다"며 "네비우스는 에이전트 시대에 걸맞은 AI 클라우드를 구축하고 있다"고 말했다.
엔비디아는 지난 1월 네비우스 경쟁사인 코어위브에도 20억 달러를 투자했고, 최근에는 영국의 클라우드 업체 엔스케일의 자금 조달에도 참여했다.
다만 엔비디아가 자사 칩 고객사에 투자하는 이른바 '순환 거래' 구조에 대한 우려도 이어지고 있다.
엔비디아의 투자 소식이 전해지자 미국 나스닥에 상장된 네비우스의 주가는 전일 종가 대비 13% 이상 급상승해 미 동부시간 오후 1시30분 기준 109달러 선을 오르내리고 있다.
comma@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>