구글 터보퀀트 반도체 급락…6배 압축에도 HBM 완판인 이유

삼성전자 -4.71%, SK하이닉스 -6.23%. 구글 터보퀀트가 AI 메모리를 6분의 1로 줄인다는 소식에, 한국 반도체 양대 산맥이 하루 만에 무너졌다. 그런데 같은 날 모건스탠리는 정반대 의견을 냈다. “오히려 호재”라고.

시장의 공포가 과했는지, 모건스탠리가 틀렸는지. 구글 터보퀀트 반도체 충격의 실체를 데이터로 직접 뜯어본다.

-4.71%
삼성전자 (3/26)
-6.23%
SK하이닉스 (3/26)
-3.4%
마이크론 (3/25)
-3.22%
코스피 지수 (3/26)

📌 핵심 요약

  • 구글 터보퀀트는 AI 추론 시 KV 캐시 메모리를 6배 압축하는 알고리즘이다
  • HBM 수요의 핵심인 AI 학습(Training)과 모델 가중치에는 영향을 주지 않는다
  • 모건스탠리는 추론 비용 하락이 AI 도입을 확대시켜 총 메모리 수요를 늘릴 것으로 전망한다

구글 터보퀀트 반도체 충격, KV 캐시 6배 압축이란

3월 25일 구글 리서치가 공개한 터보퀀트(TurboQuant)는 대규모 언어 모델(LLM) 추론 과정에서 발생하는 KV(Key-Value) 캐시를 3비트로 압축해 메모리 사용량을 6분의 1로 줄이는 알고리즘이다. 엔비디아 H100 GPU 기준 어텐션 연산 속도를 최대 8배 끌어올리면서도 정확도 손실은 없다고 구글은 밝혔다.

KV 캐시는 LLM이 이전 문맥을 기억하기 위해 저장하는 데이터다. 대화가 길어질수록 이 캐시가 GPU 메모리를 집어삼키는데, 터보퀀트는 PolarQuant라는 회전 기법으로 벡터 구조를 단순화한 뒤 3비트 양자화를 적용한다. 별도 학습(fine-tuning) 없이 기존 모델에 바로 적용할 수 있다는 점이 시장을 놀라게 했다. 이 논문은 다음 달 ICLR 2026에서 정식 발표될 예정이다.

시장의 즉각 반응은 거셌다. 3월 25일 미국 장에서 마이크론이 -3.4%(382달러), 샌디스크 -3.5%로 하락한 데 이어, 다음 날 한국 시장에서 삼성전자 -4.71%, SK하이닉스 -6.23%, 코스피 -3.22%가 동반 급락했다. “메모리가 6분의 1만 필요하다면 HBM 수요가 급감할 것”이라는 공포가 번진 것이다.

터보퀀트가 건드리는 것과 건드리지 못하는 것

시장의 공포를 이해하려면, 먼저 HBM이 어디에 쓰이는지를 구분해야 한다.

GPU 메모리 용도 터보퀀트 영향 비중
AI 학습(Training) ❌ 영향 없음 전체 HBM 수요의 핵심
모델 가중치 적재 ❌ 영향 없음 추론 시에도 필수
추론 KV 캐시 ✅ 6배 압축 추론 메모리의 일부

터보퀀트가 줄이는 것은 추론 과정의 KV 캐시뿐이다. AI 모델을 학습시키는 데 들어가는 메모리, 모델 가중치를 GPU에 올리는 데 필요한 메모리에는 한 바이트도 영향을 주지 않는다. HBM의 핵심 수요처인 AI 학습 워크로드와 LLM 가중치 적재는 터보퀀트와 무관하다.

솔직히 말하면, “메모리 6배 압축”이라는 헤드라인만 보고 반응한 시장이 과했다. GPU 전체 메모리 중 KV 캐시가 차지하는 비율은 모델 크기와 배치 사이즈에 따라 크게 달라지며, 학습 시에는 사실상 0이다. 메모리 반도체의 딥시크 모먼트라는 표현이 나왔지만, 딥시크가 학습 효율을 혁신한 것과 달리 터보퀀트는 추론 캐시만 건드린다는 점에서 충격의 범위가 다르다.

모건스탠리가 ‘오히려 호재’라고 말하는 근거

모건스탠리 분석가 숀 김(Shawn Kim)은 터보퀀트 공개 직후 투자자 보고서에서 명확한 입장을 밝혔다. “추론 비용이 6분의 1로 줄어들면, 비용 때문에 AI 도입을 망설이던 기업들이 대거 진입한다. 이는 메모리 수요를 줄이는 것이 아니라 오히려 확대시킬 것“이라는 논리다.

경제학의 제본스 역설(Jevons Paradox)이 정확히 이 상황을 설명한다. 19세기 영국에서 증기기관의 석탄 효율이 올라가자 석탄 소비가 줄 것이라 예측했지만, 실제로는 효율적인 증기기관이 공장과 철도에 대량 보급되면서 석탄 소비가 오히려 폭증했다. 터보퀀트로 추론 단가가 낮아지면, AI 에이전트 시장과 온디바이스 AI 시장이 빠르게 확대되고, 동일 하드웨어에서 4~8배 더 긴 컨텍스트 창을 처리하는 방향으로 활용될 가능성이 높다.

뱅크오브아메리카(BofA)는 2026년 HBM 시장 규모를 546억 달러(약 82조 원)로 전망하며, 전년 대비 58% 성장을 예상한다. 삼성전자와 SK하이닉스의 2026년 HBM 물량은 이미 완판 상태다. 공급 병목은 소프트웨어가 아니라 물리적 공장 건설과 수율이 만드는 것이다 — 알고리즘 하나로 공장이 남아돌지는 않는다.

SK하이닉스 HBM 매출 점유율50%
삼성전자 HBM 매출 점유율29%
마이크론 HBM 매출 점유율17%

* 2026년 매출액 기준 예상 점유율 (다이신증권 리서치센터)

삼성전자·SK하이닉스, 급락 후 밸류에이션 점검

노무라증권은 터보퀀트 쇼크 당일인 3월 26일, 코스피 목표치 7,500~8,000 전망을 유지하면서 SK하이닉스 목표주가를 156만 원에서 193만 원으로 대폭 상향했다. 시장이 공포에 빠진 날 목표가를 올리는 건 상당한 확신이 있어야 가능한 행동이다.

삼성전자는 한 달 새 21만 6,500원에서 17만 2,700원으로 20.2% 빠졌고, SK하이닉스는 106만 1,000원에서 88만 5,000원으로 16.6% 하락했다. 이란 전쟁 장기화, 미국 자동차 관세, 그리고 터보퀀트까지 악재가 겹친 결과다. 하지만 SK하이닉스 PER 5.6배라는 숫자는 글로벌 반도체 기업 중 가장 낮은 수준이다. SK하이닉스 ADR 미국 상장 추진 소식까지 겹치면서, 이 밸류에이션이 장기간 유지되기는 어렵다는 시각이 우세하다.

마이크론은 직전 분기(Q2 FY2026) 매출 238.6억 달러로 컨센서스를 38% 상회하는 역대급 실적을 냈고, Q3 가이던스 335억 달러까지 제시한 상태다. 실적이 이 수준인데 알고리즘 논문 하나로 구조적 수요가 꺾인다고 보기는 어렵다.

투자자가 기억할 숫자

546억 달러. BofA가 전망한 2026년 HBM 시장 규모이고, 전년 대비 58% 성장하는 숫자다. 터보퀀트가 발표된 뒤에도 이 전망치를 하향 조정한 주요 IB는 아직 없다.

종합하면, 터보퀀트가 추론 효율을 높이는 것은 사실이지만, 이것이 HBM 수요를 구조적으로 줄인다는 시장의 공포는 과도하다고 본다. 근거는 ①HBM 핵심 수요처인 AI 학습과 가중치 적재에 터보퀀트가 영향을 주지 않으며 ②제본스 역설이 시사하듯 추론 비용 하락은 AI 도입 확대로 이어져 총 메모리 수요를 늘릴 가능성이 높다는 점이다. 이 판단이 틀리려면, 주요 클라우드 기업(마이크로소프트·메타·아마존)이 2027년 AI 인프라 투자를 20% 이상 줄여야 하는데 — 현재 발표된 CapEx 계획을 보면 그 가능성은 낮다.

터보퀀트 쇼크 후 투자 체크리스트

☑️ 내 반도체 포지션의 비중이 포트폴리오 30% 이하인가
☑️ HBM 수요의 핵심(학습 vs 추론)을 구분하고 있는가
☑️ PER 5~6배 구간에서 추가 하락 대비 분할 매수 계획이 있는가
☑️ 2027 CapEx 가이던스(5~6월 실적 발표)까지 기다릴 인내가 있는가

터보퀀트 논문 원문과 기술 세부 사항은 구글 리서치 공식 블로그에서 확인할 수 있다.

⚠️ 본 글은 정보 제공 목적으로 작성되었으며, 투자 권유가 아닙니다. 모든 투자의 책임은 투자자 본인에게 있습니다.

snakestock.com

ETF · 거시경제 · 절세전략

공신력 있는 공식 자료를 바탕으로 개인투자자에게 실질적인 투자 정보를 제공합니다. 특정 종목의 매수·매도를 추천하지 않습니다.

댓글 남기기