본문 바로가기
경제

엔비디아, 초고속 S램 칩 선보인다

by 부자되는 정보 2026. 3. 15.
반응형

만능 칩 전략에서 '맞춤형 추론'으로의 대전환

  • GTC 2026의 핵심 카드: 엔비디아가 오는 16일 개막하는 GTC에서 AI **'추론(Inference)'**에 특화된 전용 칩을 공개합니다. 이는 그동안 학습용 범용 GPU 시장을 지배하던 전략에서 한 걸음 나아가, 구글의 TPU 등 특정 작업용 칩(ASIC)들의 추격을 뿌리치겠다는 의지입니다.
  • 그록(Groq)의 DNA: 지난해 인수한 이스라엘 스타트업 그록의 LPU 기술이 처음으로 적용됩니다. 비싸고 수급이 어려운 HBM(고대역폭 메모리) 대신, 처리 속도가 훨씬 빠르고 지연 시간이 거의 없는 **S램(Static RAM)**을 주력으로 사용하여 가격 경쟁력과 효율성을 동시에 잡았습니다.
  • 변화된 판도, AI 에이전트: 젠슨 황 CEO가 전략을 수정한 결정적 계기는 'AI 에이전트'의 등장입니다. 단순 학습을 넘어 실시간으로 판단하고 행동하는 AI가 늘어나면서, 빠르고 저렴한 추론 전용 칩의 수요가 폭발했기 때문입니다.
  • 추론 시장의 압도적 비중: BofA에 따르면 2030년 AI 데이터센터 시장의 75%가 추론용이 될 전망입니다. 엔비디아는 이번 GTC를 통해 학습부터 추론까지 AI 포트폴리오를 완벽히 구축하며 시총 1위의 자존심을 지킬 것으로 보입니다.

 

반응형

'똑똑한 뇌'를 넘어 '빠른 발'을 만드는 기술

그동안 엔비디아가 거대한 지식을 가르치는 '최고의 교수님(학습용 GPU)'이었다면, 이제는 현장에서 즉각 대답하고 실행하는 '민첩한 해결사(추론용 칩)'까지 자처하고 나섰습니다. 특히 수급난에 시달리는 HBM 대신 S램을 선택한 것은 공급망 리스크를 줄이면서도 성능을 극대화하겠다는 영리한 수싸움으로 보입니다. AI 에이전트가 우리 일상에 깊숙이 들어올수록, '얼마나 많이 아느냐'보다 '얼마나 빨리 반응하느냐'가 중요해진 시점입니다.

 

엔비디아 GTC 2026 키노트 주요 내용, S램 기반 AI 추론 칩의 장점과 한계, 그록(Groq) LPU 아키텍처 분석, 구글 TPU v6 vs 엔비디아 추론 전용 칩 비교, 차세대 AI 칩 '베라 루빈' 및 '파인만' 로드맵, AI 에이전트 시장 규모 전망 2030, 데이터센터용 S램 시장 성장 가능성

반응형