데이터 없이 학습하는 AI: David Silver의 Ineffable Intelligence가 던진 질문

3줄 요약

DeepMind에서 AlphaGo·AlphaZero를 이끈 David Silver가 영국 런던에 Ineffable Intelligence를 설립하고 2026년 4월 27일 보도 기준 시드 라운드 $1.1B(밸류 $5.1B)를 유치했다.
회사 비전은 "인간 데이터 없이 학습하는 슈퍼러너(superlearner)"다. AlphaZero식 self-play를 일반 영역으로 확장해 인터넷 텍스트·이미지·비디오 의존을 제거한다.
NYT v. OpenAI를 비롯한 AI 학습 데이터 저작권 소송이 누적되는 시점에 데이터 의존성 자체를 구조적으로 회피하는 기술 노선의 부상이다. LLM 시대에 가려져 있던 강화학습·시뮬레이션·자가 생성 데이터의 IP 가치가 다시 부상한다.

기술 개념: '데이터 없이 학습한다'의 의미

LLM과 RL의 학습 방식 차이

LLM(GPT, Claude, Gemini 등)은 인터넷에 있는 인간이 만든 텍스트·이미지·비디오를 대규모로 학습한다. 학습의 출발점이 인간 데이터다. 더 좋은 모델을 만들려면 더 많은, 더 깨끗한 데이터를 확보해야 한다.

강화학습(Reinforcement Learning, RL)은 다르다. 에이전트가 환경과 상호작용하며 시행착오로 학습한다. AlphaGo Zero(2017)는 인간 기보 없이 자신과 수백만 판을 두며 바둑을 마스터했고, AlphaZero는 같은 방식으로 체스·쇼기까지 정복했다.

항목	LLM	RL
학습 출발점	인간이 만든 텍스트/이미지/비디오	시뮬레이션 환경에서의 자기 경험
데이터 확보 방식	라이선스·크롤링	환경 설계·self-play
핵심 자산	데이터셋, 모델 가중치	시뮬레이터, 보상 함수, 자가 생성 데이터
저작권 리스크	높음 (NYT·Getty 등 소송)	낮음 (자가 생성)
한계	인간 지식 상한선	환경 설계의 표현력 한계

Ineffable의 핵심 주장

David Silver와 강화학습 권위자 Richard Sutton(2024 Turing Award 수상자)이 공저한 논문 "Welcome to the Era of Experience"가 회사 비전의 토대다 (Mothcloud, Sequoia).

"AI의 다음 도약은 모델에 더 많은 토큰을 먹이는 것이 아니라, 에이전트가 자기 경험을 통해 모든 지식의 기초를 자가 발견하는 데서 나온다."

Silver 본인의 발언:

"우리는 인간이 아는 것을 넘어서고 싶다. 그러려면 다른 종류의 방법이 필요하다. AI가 스스로 알아내고, 인간이 모르는 새로운 것을 발견해야 한다."

즉 LLM이 인간 지식의 압축·재배치를 잘하는 시스템이라면, RL 슈퍼러너는 인간이 모르는 영역을 자가 탐험으로 발견하는 시스템이라는 주장이다.

작은 결론: '데이터 없이'는 데이터가 0이라는 뜻이 아니라, 인간이 만든 데이터에 대한 의존성을 제거한다는 뜻이다. 자가 생성 데이터는 무한히 만들어진다.

왜 지금 주목받는가

학습 데이터 저작권 소송의 누적

2024~2025년 미국·유럽에서 AI 학습 데이터 관련 주요 소송이 다수 진행됐다.

소송 원고 피고 쟁점

소송	원고	피고	쟁점
NYT v. OpenAI	The New York Times	OpenAI, Microsoft	신문 기사 무단 학습·재생성
Authors Guild v. OpenAI	미국 작가단체	OpenAI	도서 무단 학습
Getty Images v. Stability AI	Getty Images	Stability AI	사진 무단 학습·워터마크 잔존
Sarah Silverman v. Meta/OpenAI	작가 3인	Meta, OpenAI	도서 데이터 학습

이런 소송은 LLM 사업자에게 (1) 라이선싱 비용, (2) 패소 시 거액 손해배상 리스크, (3) EU AI Act·국가별 데이터 출처 공시 부담을 누적시켜 왔다.

산업의 두 갈래 대응

이런 압력에 대해 AI 산업은 두 갈래로 대응하기 시작했다.

라이선싱 합의 노선: OpenAI ↔ News Corp, Anthropic ↔ Reddit 등 거액 라이선싱 합의로 학습 데이터를 합법화.
데이터 회피 노선: 인간 데이터 자체에 의존하지 않는 학습 방법 추구.

Ineffable Intelligence는 후자의 가장 야심 찬 시도다.

'코코넛 라운드' 현상

2026년 들어 스타 AI 연구자가 시드 단계에서 십억 달러 규모를 유치하는 사례가 잇따라 발생했고, 업계는 이를 "코코넛 라운드(coconut round)"라 부른다 (TechCrunch).

회사 핵심 인물 시드 규모 밸류에이션

회사	핵심 인물	시드 규모	밸류에이션
AMI Labs	Yann LeCun (전 Meta AI 수석, Turing Award)	$1.03B	$3.5B (pre-money)
Recursive Superintelligence	Tim Rocktäschel (전 DeepMind 수석)	$500M~$1B	비공개
Ineffable Intelligence	David Silver (전 DeepMind RL 리드)	$1.1B	$5.1B

세 회사 모두 LLM 패러다임의 한계를 전제하고 강화학습·세계 모델·자가 학습 등 대안 접근을 표방한다는 공통점이 있다. 단일 회사 이벤트가 아니라 산업 전체의 분기점에서 자본이 동시에 베팅을 시작한 흐름이다.

작은 결론: Ineffable의 메가 라운드는 한 인물의 명성이 아니라, AI 산업의 IP 리스크 회피 전략 전체에 대한 자본의 베팅이다.

시사점

시사점1: 자가 생성 데이터의 영업비밀화

보호 대상:

시뮬레이션 환경 (코드 + 환경 정의 데이터)
평가 메트릭 (어떤 지표로 진보를 측정하는가)
중간 체크포인트 (학습 중간 단계 모델 가중치)
자가 생성 데이터셋 (시뮬레이션 결과물)

시사점 2: 영국 'Sovereign AI' 펀드의 직접 진입

Ineffable 시드 라운드에 British Business Bank와 Sovereign AI(영국 정부 AI 펀드)가 직접 참여한 것은 의미 있는 신호다.

국가가 AI 슈퍼인텔리전스 경쟁의 직접 투자자로 등장
향후 영국·유럽 시장에서 AI 기술 IP의 정부 사용권·라이선싱·국가안보 제한이 새 변수가 될 가능성
미국 In-Q-Tel(CIA 벤처) 모델이 AI 영역으로 확장되는 흐름의 일환

핵심 정리

Ineffable Intelligence: David Silver가 2025-11 설립한 영국 런던 기반 AI 스타트업. 2026-04 시드 라운드 $1.1B·밸류 $5.1B.
비전: 인간 데이터 없이 시행착오로 학습하는 슈퍼러너. AlphaZero 일반화. "Era of Experience" 논문(Silver+Sutton)이 토대.
코코넛 라운드 흐름: AMI Labs·Recursive Superintelligence와 같은 LLM 대안 노선에 자본이 동시 베팅.
IP 시사점: 강화학습 청구항 부활, 자가 생성 데이터의 영업비밀화, 영국 Sovereign AI 펀드 진입, AI 자문 영역의 분기.
리스크: Era of Experience의 일반 영역 미검증, 데이터 없음의 마케팅적 단순화, 기존 RL 기본 특허와의 충돌 가능성.

참고자료

Sequoia Capital, "Partnering with Ineffable Intelligence: A Superlearner for the Era of Experience" (2026-04) — 투자사 공식 발표문, 회사 비전·투자자 구성 1차 출처
Fortune, "Exclusive: Google DeepMind researcher David Silver leaves to launch his own AI startup" (2026-01-30) — Silver의 DeepMind 퇴사·Ineffable 합류 단독 보도
TechCrunch, "DeepMind's David Silver just raised $1.1B to build an AI that learns without human data" (2026-04-27) — 시드 라운드 발표 보도, 코코넛 라운드 용어

B-LOG 관련 글

Amazon이 Anthropic에 50억을 주고, Anthropic은 1,000억을 쓰기로 했다 — 이 계약이 흥미로운 이유 — AI 산업 자본 흐름의 또 다른 결: Amazon-Anthropic은 LLM 진영 빅테크 결합, Ineffable은 LLM 패러다임 회피 진영의 메가 베팅 — AI 진영 분기의 두 좌표.
TurboQuant 완전 정리: Google의 KV 캐시 압축 기술이 AI 메모리 반도체 시장에 미치는 충격 — LLM 효율화의 한 갈래(메모리 압축) vs 강화학습 기반 데이터 회피의 갈래 — AI 산업 진화 두 축의 비교 프레임.
AI 특허, 미국에서 연속 무효판결 — Section 101이 AI 출원 전략을 바꾼다 — 미국 § 101 적격성이 AI 청구항 설계를 흔들고 있는 시점에 RL 기반 청구항이 부상한다 — 시스템·하드웨어 결합형 청구항 설계의 새 변수.
NVIDIA는 왜 로봇 AI를 공짜로 풀었나 — Physical AI 패권 전쟁 — AI 플랫폼 패권의 IP 시각: NVIDIA의 락인 전략, Ineffable의 자가 생성 데이터 영업비밀화 — Physical AI/RL 슈퍼러너로 이어지는 IP 전략의 진화.

'AI 노트' 카테고리의 다른 글

GPT-5.5와 GPT-5.5-Cyber 동시 출시 - OpenAI 도메인 특화 LLM 시대 개막 (0)	2026.05.12
Anthropic이 사용한도를 높이고 SpaceX와 컴퓨트 계약을 맺었다 - Claude 인프라 자체화의 시작 (0)	2026.05.11
Arm 자체 칩 공개: 136코어 Neoverse V3와 AGI 추론 시장 진입 정리 (0)	2026.04.28
TurboQuant 완전 정리: Google의 KV 캐시 압축 기술이 AI 메모리 반도체 시장에 미치는 충격 (0)	2026.03.31
Physical AI 플랫폼 생태계의 패권 싸움의 승자는 ? (0)	2026.03.16

3줄 요약

기술 개념: '데이터 없이 학습한다'의 의미

LLM과 RL의 학습 방식 차이

Ineffable의 핵심 주장

왜 지금 주목받는가

학습 데이터 저작권 소송의 누적

산업의 두 갈래 대응

'코코넛 라운드' 현상

시사점

시사점1: 자가 생성 데이터의 영업비밀화

시사점 2: 영국 'Sovereign AI' 펀드의 직접 진입

핵심 정리

참고자료

B-LOG 관련 글

'AI 노트' 카테고리의 다른 글

티스토리툴바