TurboQuant 완전 정리: Google의 KV 캐시 압축 기술이 AI 메모리 반도체 시장에 미치는 충격
·
AI 노트
📌 한 줄 요약: Google Research가 ICLR 2026에 발표한 TurboQuant는 LLM의 KV 캐시를 3~4비트로 압축해 메모리 6배 절감·H100 추론 8배 가속을 달성하며, AI 인프라와 메모리 반도체 IP 판도를 바꾸는 기술로 주목받고 있다.개요2026년 초, Google Research와 KAIST(한국과학기술원), NYU(뉴욕대학교) 연구팀이 공동 개발한 "TurboQuant"가 ICLR 2026(International Conference on Learning Representations, 기계학습 최고 학술대회 중 하나)에 채택되어 공개됐다. TurboQuant는 LLM(대형 언어 모델) 추론(inference) 시 발생하는 KV 캐시(Key-Value Cache, 이전 토..
Physical AI 플랫폼 생태계의 패권 싸움의 승자는 ?
·
AI 노트
요약 Physical AI 로보틱스의 패권 경쟁은 "하드웨어를 누가 만드느냐"가 아니라 "AI가 물리 세계를 학습하는 방법론을 누가 선점하느냐"의 싸움으로 바뀌고 있다. "이 모델은 오픈소스로 공개됩니다."2026년 3월 16일, NVIDIA 젠슨 황 CEO는 GTC 2026 기조연설에서 Isaac GR00T N1.6를 발표하며 이렇게 말했습니다. 코드는 GitHub에, 모델 가중치는 Hugging Face에 공개됐습니다. 그런데 여기서 한 가지 의문이 생깁니다. NVIDIA는 왜 이 귀한 기술을 공짜로 풀었을까요? 그리고 정말로 '공짜'일까요? 같은 날, Rivian에서 분사한 스타트업 Mind Robotics는 조용히 5억 달러(약 6,700억 원)를 투자받았습니다. 투자자들은 무엇을 믿고 이 돈을..