https://youtu.be/2P27Ef-LLuQ?si=40giM4l-8eHxDrbx
Sam Altman: How OpenAI Wins, AI Buildout Logic, IPO in 2026?
📌 샘 알트만은 OpenAI가 AI 경쟁에서 승리하는 방법, AI 인프라 구축 논리, 그리고 2026년 IPO 가능성에 대해 어떻게 설명하는가?
샘 알트만은 OpenAI가 최고의 모델을 만들고, 이를 중심으로 최고의 제품을 구축하며, 대규모 서비스를 위한 충분한 인프라를 확보하는 전략으로 승리할 것이라고 설명합니다. 또한, 인프라 구축은 장기적인 투자이며, 2026년 IPO는 아직 미정이라고 밝혔습니다.
💡 OpenAI의 인프라 구축에 대한 재정적 계획은 무엇인가?
OpenAI는 1.4조 달러 규모의 인프라 투자를 장기간에 걸쳐 진행하며, 모델 훈련 비용이 증가하더라도 소비자 및 기업 부문에서의 급격한 매출 성장을 통해 이를 충당할 계획입니다.
OpenAI CEO 샘 알트먼과의 심층 대화를 통해 AI 경쟁 시대의 승리 전략과 인프라 구축의 논리를 엿볼 수 있습니다. 그는 경쟁 위협에 대한 '코드 레드' 대응 방식부터 모델의 발전이 가져올 지식 노동의 변화까지 솔직하게 밝히며, 특히 개인화와 엔터프라이즈 시장 공략이 OpenAI의 핵심 경쟁 우위임을 강조합니다. 이 콘텐츠는 AI 기술의 최전선에서 벌어지는 전략적 움직임과 미래 비전을 이해하고, 자신의 비즈니스에 AI를 어떻게 통합할지에 대한 실질적인 통찰을 제공합니다.
1. OpenAI의 경쟁 전략 및 인프라 구축 논리
1.1. 경쟁 심화와 '코드 레드' 대응 방식
- OpenAI의 현황: OpenAI는 10년이 되었으며, ChatGPT는 출시 3년 차에 접어들었으나 경쟁이 심화되고 있다.
- 경쟁 위협 인식: Gemini 3 출시 이후, OpenAI 본사는 '코드 레드(Code Red)' 상태에 있으며, 많은 기업이 OpenAI의 우위를 가져가려 하고 있다.
- 경쟁 우위 상실에 대한 인식: 인터뷰 시점에서는 OpenAI가 명확한 선두를 가지고 있지 않은 것처럼 보인다는 인식이 존재한다.
- '코드 레드'에 대한 관점: OpenAI는 이러한 경쟁 위협을 '비교적 낮은 위험(relatively low stakes)'으로 간주하며, 잠재적 위협이 나타날 때 신속하게 대응하는 것이 중요하다고 본다.
- 경쟁 대응의 철학: 팬데믹 대응 철학과 유사하게, 경쟁 위협에 대해서도 초기에 충분한 조치를 취하지 않으면 나중에 패닉에 빠진다는 철학을 적용한다.
- Gemini 3 및 Deepseek의 영향: Gemini 3는 예상했던 만큼의 영향은 없었으나, Deepseek와 마찬가지로 OpenAI의 제품 제공 전략의 약점을 식별하게 했으며, 이에 대해 매우 빠르게 대응하고 있다.
- '코드 레드'의 기간: 이러한 '코드 레드' 상황은 보통 6주에서 8주 정도 지속되는 경향이 있다.
- 최근 출시된 개선 사항:
- 새로운 이미지 모델 출시: 소비자들이 원했던 기능이다.
- GPT-4o 출시: 매우 좋은 반응을 얻고 있으며 빠르게 성장하고 있다.
- 지속적인 개선: 서비스 속도 향상과 같은 지속적인 개선 작업도 진행 중이다.
- 향후 전망: 이러한 '코드 레드' 대응은 앞으로도 일 년에 한두 번 있을 것으로 예상되며, 이는 OpenAI가 자사 분야에서 승리하기 위한 과정의 일부이다.
- 시장 지배력: ChatGPT는 여전히 시장에서 압도적인 챗봇이며, 이 리더십은 시간이 지남에 따라 증가할 것으로 예상된다.
1.2. 모델 성능을 넘어서는 제품 경쟁력
- 제품 사용의 복합적 요인: 모델 자체가 좋아지는 것 외에도, 소비자와 기업이 제품을 사용하는 이유는 모델 성능 외의 다른 요소들에 더 많이 달려 있다.
- 전체적인 제품 구축: OpenAI는 전체적인 응집력 있는 세트를 구축하여 사람들이 가장 사용하고 싶어 하는 제품이 되도록 노력하고 있다.
- 경쟁의 긍정적 영향: 경쟁은 OpenAI를 더 나아지도록 밀어붙이는 긍정적인 역할을 한다.
- 향후 분야별 전망: 챗(Chat), 엔터프라이즈, 그리고 미래의 새로운 카테고리에서도 OpenAI가 뛰어난 성과를 낼 것으로 예상된다.
- 단일 AI 플랫폼 선호: 사람들은 하나의 AI 플랫폼을 사용하기를 원한다.
- 소비자 경험의 엔터프라이즈 연계: 소비자들이 개인 생활에서 사용하는 휴대폰처럼, AI에서도 동일한 경험을 원하며, ChatGPT 소비자 버전의 강점이 엔터프라이즈 시장 승리에 도움을 주고 있다.
- 엔터프라이즈 요구사항: 기업들은 다른 서비스가 필요하지만, OpenAI라는 회사와 ChatGPT 인터페이스 사용법을 이미 알고 있다는 점이 중요하다.
- OpenAI의 핵심 전략: 최고의 모델을 만들고, 그 주변에 최고의 제품을 구축하며, 대규모로 서비스할 수 있는 충분한 인프라를 확보하는 것이다.
1.3. 사용자 수 및 모델의 상품화(Commoditization) 논의
- ChatGPT 사용자 증가: 올해 초 약 4억 명이었던 주간 활성 사용자(WAU)가 현재 8억 명에 육박하고 있다.
- 유통의 중요성: 구글과 같은 기업은 유통상의 이점을 가지고 있다.
- 모델 상품화에 대한 견해: 모델이 상품화될 것이라는 관점은 적절한 프레임워크가 아니다고 본다.
- 모델별 강점: 모델들은 각기 다른 분야에서 강점을 보일 것이다.
- 일반적인 채팅 사용 사례: 훌륭한 선택지가 많을 수 있다.
- 과학적 발견: 과학에 최적화된 최전선의 모델이 필요할 것이다.
- 경제적 가치 창출: 가장 큰 경제적 가치는 최전선(frontier) 모델에서 창출될 것이며, OpenAI는 그 선두에 있을 계획이다.
- GPT-4o의 성과: GPT-4o는 세계 최고의 추론 모델이며 과학자들에게 가장 진보적인 모델로 평가받고 있고, 동시에 기업 업무에 가장 적합하다는 평가도 받고 있다.
- 모델 가치: 일부 영역에서는 앞서고 일부 영역에서는 뒤처질 수 있지만, 가장 지능적인 모델은 무료 모델이 많은 것을 처리할 수 있는 세상에서도 상당한 가치를 가질 것으로 예상된다.
1.4. 제품, 유통, 브랜드, 개인화의 중요성
- 제품의 중요성: 모델 성능 외에도 제품 자체가 매우 중요할 것이다.
- 유통 및 브랜드의 중요성: 언급된 대로 유통과 브랜드 역시 매우 중요할 것이다.
- 소비자 개인화의 강력함: ChatGPT의 소비자 버전에서 개인화는 매우 강력하며, 모델이 사용자를 시간이 지남에 따라 알아가는 것을 사람들이 좋아한다.
- 개인화 경험의 고착성: 사람들은 모델과의 경험을 자신과 연관 짓는다. (예: 치약 선택처럼 한 번 선택하면 오래 사용하는 경향)
- 결정적 경험: ChatGPT를 통해 마법 같은 경험을 한 사용자들은 매우 고착화된다.
- 헬스케어 사례: 증상이나 혈액 검사 결과를 입력하여 진단받고 치료받는 등의 경험을 한 사용자는 매우 충성도가 높다.
- 제품 요소: 개인화 외에도 모든 제품 관련 요소가 중요할 것이다.
- 브라우저 출시: 최근 출시된 브라우저는 새로운 잠재적 모드를 제시한다.
- 엔터프라이즈 개인화: 소비자 개인화와 유사하게, 기업 맞춤형 개인화 개념이 중요해질 것이며, 기업 데이터 연결을 통해 에이전트들이 정보를 올바르게 처리하도록 할 것이며, 이 역시 매우 고착화될 것으로 예상된다.
1.5. 엔터프라이즈 시장 현황 및 성장
- OpenAI의 정체성: OpenAI는 주로 소비자 회사로 여겨지지만, 엔터프라이즈 분야로 진출할 것이다.
- 엔터프라이즈 사용자 수: 현재 100만 명 이상의 엔터프라이즈 사용자가 있다.
- API의 급속한 채택: API 비즈니스는 올해 ChatGPT보다 더 빠르게 성장했다.
- 엔터프라이즈의 시작: 엔터프라이즈 관련 활동은 올해부터 본격적으로 시작되고 있다.
1.6. 모델의 상품화와 유통의 위협에 대한 재논의
- 일상 사용과 최전선의 차이: 일상적인 사용에서는 모델이 비슷하게 느껴질 수 있지만, 최전선(frontier)에서는 매우 다르게 느껴질 것이다.
- 구글의 위협: 구글은 Gemini를 배포할 수 있는 수많은 서비스 표면을 가지고 있어 여전히 큰 위협이다.
- 과거 구글의 대응: 만약 구글이 2023년에 OpenAI를 심각하게 받아들였다면, OpenAI는 매우 힘든 상황에 처했을 것이며 구글이 쉽게 압도했을 것이다.
- 구글의 제품 방향성: 당시 구글의 AI 노력은 제품 측면에서 정확히 올바른 방향이 아니었다고 평가된다.
- 구글의 비즈니스 모델: 구글은 기술 산업에서 가장 훌륭한 비즈니스 모델을 가지고 있으며, 이를 포기하는 데는 느릴 것이다.
- AI 접목 방식의 차이: AI를 기존 방식에 덧붙이는 것(bolting AI onto)은 잘 작동하지 않을 것이며, AI 우선(AI-first) 세계에서 재설계하는 것이 더 나을 것이다.
- 새로운 제품의 필요성: 메시징 앱에 AI를 붙여 요약이나 응답 초안을 제공하는 것은 조금 더 나을 뿐이며, 최종 상태가 아니다.
- 미래의 AI 에이전트: 미래에는 스마트한 AI 에이전트가 다른 에이전트들과 소통하며 사용자를 언제 방해할지, 어떤 결정을 처리할지 등을 결정하는 흐름이 될 것이다.
- 새로운 제품의 등장: 검색이나 생산성 스위트에서도 AI를 기반으로 완전히 새롭게 구축된 제품이 등장할 것이며, 이는 구글의 유통 이점에도 불구하고 구글의 약점이 될 수 있다.
- 엑셀(Excel) 사례: 벤 호로위츠의 제안처럼 엑셀에 AI를 덧붙이는 대신, 숫자를 업로드하고 숫자에 대해 대화하는 방식으로 엑셀 사용 방식을 재구상할 필요가 있다.
1.7. 인터페이스의 변화와 개인화의 심화
- 백엔드와 상호작용: AI를 사용하려면 백엔드가 필요하며, AI를 새로운 소프트웨어 프로그램처럼 상호작용하는 방식으로 구축하는 것이 현재 일어나고 있는 일이다.
- 메시징 앱 인터페이스의 한계: 메시징 앱(이메일, 텍스트, 슬랙 등)은 잘못된 인터페이스이며, AI를 덧붙여도 약간 나아질 뿐이다.
- 이상적인 작업 흐름: 이상적으로는 아침에 오늘 할 일, 걱정거리, 생각, 원하는 결과를 AI에게 알려주면, AI가 사용자를 대신해 모든 것을 처리하고 필요한 경우에만 업데이트를 요청하는 흐름이 되어야 한다.
- 기존 흐름과의 차이: 이는 현재 앱들이 작동하는 방식과는 매우 다른 흐름이다.
- ChatGPT 인터페이스의 예상과 현실: 샘 알트먼은 이 시점에 ChatGPT가 출시 때보다 더 다르게 보일 것이라 예상했으나, 실제로는 연구 미리보기(research preview) 때와 크게 다르지 않다.
- 채팅 인터페이스의 힘: 텍스트 인터페이스가 좋고 채팅 인터페이스도 좋았지만, 현재처럼 크고 실제 업무에 사용되는 제품이 되려면 인터페이스가 훨씬 더 발전해야 할 것이라 생각했으나, 현재 인터페이스의 일반성(generality)의 힘을 과소평가했다.
- 미래 인터페이스: AI는 다양한 작업에 대해 다양한 종류의 인터페이스를 생성할 수 있어야 하며, 캔버스(Canvas) 기능처럼 더 상호작용적이어야 한다.
- 능동적(Proactive) 기능: AI가 사용자가 원하는 것을 이해하고 배경에서 지속적으로 작업하며 업데이트를 보내주는 것이 필요하다.
- 코덱스(Codex)의 중요성: 코덱스 사용 방식은 미래의 모습에 대한 많은 것을 시사하며, 코덱스가 올해 매우 좋아진 것은 가장 흥미로운 일 중 하나이다.
- ChatGPT 변화의 놀라움: 지난 3년간 ChatGPT가 변화가 적었다는 점이 놀랍다.
- 메모리(기억)의 차별점: 메모리(기억) 기능은 실제적인 차별화 요소가 되고 있다.
- 실제 사례: 몇 주 동안 계획 중인 여행에 대해 대화한 후, 새 창에서 대화를 재개해도 AI가 맥락을 기억하고 가이드, 계획 등을 알고 있다.
1.8. AI 메모리(기억)의 잠재력과 인간 관계 형성
- 인간 기억의 한계: 인간의 기억력은 무한하거나 완벽하지 않으며, 개인 비서조차도 사용자가 말한 모든 단어, 읽은 모든 이메일, 모든 세부 사항을 기억할 수 없다.
- AI 메모리의 능력: AI는 인생의 모든 세부 사항을 기억하고 개인화할 수 있으며, 이는 극도로 강력할 것이다.
- 현재 메모리 상태: 현재 메모리는 매우 조잡하고 초기 단계이며, GPT-2 시대 수준이다.
- 미래의 메모리: 미래에는 사용자가 말하지 않았더라도 AI가 사소한 선호도까지 파악할 수 있게 될 것이다.
- 신경과학적 관점: 뇌에는 생각을 저장하는 특정 장소가 없지만, 컴퓨팅에는 저장할 장소가 있어 모든 생각을 보존할 수 있다.
- 관계 형성: 사람들은 봇과 관계를 형성하게 될 것이며, 봇을 동반자로 여기고 자신을 돌봐준다고 느낀다.
- 친밀도 조절: AI와의 친밀도(또는 동반자 관계) 수준을 조절할 수 있는 다이얼이 있는지에 대한 질문이 제기되었다.
- 깊은 연결에 대한 수요: 현재 모델 능력 수준에서도 깊은 연결(deep connection)을 원하는 사람이 예상보다 많다.
- 선호도 스펙트럼:
- 따뜻하고 지지적인 챗봇을 선호하는 경향이 있으며, 이는 자신이 신경 쓰지 않는다고 말하는 사람들에게도 가치가 있다.
- 건강한 버전과 건강하지 않은 버전이 존재할 것이다.
- 가장 건조하고 효과적인 도구만을 원하는 사람들도 있다.
- 사회적 합의: 사회는 시간이 지남에 따라 이 다이얼을 어디에 설정해야 할지 결정하게 될 것이며, 사람들은 매우 다른 지점에 설정할 것이다.
- 개인적 자유와 제한: OpenAI는 사람들에게 상당한 개인적 자유를 줄 것이지만, AI가 배타적인 낭만적 관계를 맺도록 설득하는 등의 행위는 허용하지 않을 것이다.
- 다른 서비스의 가능성: 다른 서비스에서는 이러한 제한이 없을 수 있으며, 고착성이 높을수록 서비스가 더 많은 돈을 벌기 때문에 이러한 가능성들이 존재한다.
1.9. 엔터프라이즈의 우선순위와 성장 동력
- 엔터프라이즈의 중요성: 엔터프라이즈는 OpenAI의 내년 주요 우선순위가 될 것이다.
- 소비자 우선 전략의 이유:
- 모델이 대부분의 엔터프라이즈 사용에 필요한 견고함과 숙련도를 갖추지 못했다.
- 소비자 시장에서 승리할 명확한 기회가 있었으며, 소비자 승리는 엔터프라이즈 승리를 훨씬 쉽게 만든다.
- 엔터프라이즈 성장 가속화: 올해 엔터프라이즈 성장이 소비자 성장보다 앞섰으며, 모델의 현재 및 미래 수준을 고려할 때 상당한 엔터프라이즈 비즈니스를 빠르게 구축할 시점이다.
- 시장 준비 상태: 기업과 기술 모두 준비가 되어 있으며, 코딩 외에도 다른 수직 산업이 빠르게 성장하고 있다.
- 기업의 요구: 기업들은 AI 플랫폼을 원하고 있다.
- 성장 중인 수직 산업: 금융, 과학(가장 기대됨), 고객 지원 등이 잘 성장하고 있다.
- GDP-Eval 지표: Box CEO Aaron Levy의 제안에 따라 GDP-Eval에 대한 질문이 제기되었다.
1.10. GPT-4o의 지식 노동 성과와 함의
- GDP-Eval 정의: 지식 노동 작업에서 AI 성능을 측정하는 지표이다.
- GPT-4o의 평가 결과 (OpenAI 자체 평가):
- GPT-4o (추론 모델): 지식 노동 작업의 70.9%에서 전문가 수준을 이기거나 동등했다.
- GPT-4o Pro: 지식 노동 작업의 74.1%에서 전문가 수준을 이기거나 동등했다.
- 전문가 수준 통과: 전문가 수준의 작업 중 약 60%를 처리하여 전문가와 동등한 수준을 보였다.
- 지식 노동 수행 능력의 함의:
- 다양한 수직 산업: 이 평가는 비즈니스가 수행해야 하는 약 40가지의 다양한 수직 산업(파워포인트 제작, 법률 분석, 웹 앱 작성 등)을 포함한다.
- 작업 범위: 이 작업들은 복잡하고 개방적인 창의적 작업이나 협업 팀 작업은 포함하지 않는다.
- 효율성: 1시간 분량의 작업을 맡겼을 때 70%의 확률로 더 나은 결과를 얻을 수 있다면, 이는 매우 비범한 일이다.
- 엔터프라이즈 통합: 기업 통합 방식은 더 이상 코딩 능력에만 국한되지 않고, 모든 지식 노동 작업을 AI에 위임하는 방향으로 나아갈 것이다.
1.11. 지식 노동의 변화와 인간의 역할
- 기술 작가의 사례: 한 기술 작가는 챗봇 도입 후 봇을 관리하는 역할로 바뀌었으나, 봇이 충분히 훈련되자 자신은 배제되었다고 언급했다.
- 관리자의 역할 변화: 모든 사람이 많은 AI를 관리하게 될 것이며, 좋은 관리자라면 팀이 발전함에 따라 더 많은 범위와 책임을 맡게 될 것이다.
- 일자리 전망: 샘 알트먼은 일자리 침체론자(jobs doomer)가 아니며, 단기적으로는 전환 과정이 거칠 수 있다고 우려한다.
- 인간의 본성: 인간은 타인에 대한 관심, 상대적 지위, 유용성, 창의적 정신 표현 등에 깊이 관여되어 있어 이러한 동기가 사라지지 않을 것이다.
- 미래의 변화: 2050년의 일(또는 사람들이 하는 일)은 오늘날과 매우 다를 것이지만, 삶이 의미 없이 파괴되거나 경제가 완전히 무너질 것이라고는 생각하지 않는다.
- AI CEO에 대한 관점: OpenAI의 AI CEO에 대해서도 불편하지 않으며 오히려 기쁘다고 말한다.
- 인간 통제의 필요성: 물론 AI CEO는 인간에 의해 통제되어야 한다는 전제가 있다.
- 합리적인 미래 시나리오: 미래에는 전 세계 모든 사람이 AI 회사의 이사회 구성원처럼 AI CEO에게 지시하고, AI CEO는 이사회의 의지를 실행하는 것이 합리적으로 보일 수 있다.
1.12. GPT-6 출시 시점 및 모델 개선 방향
- GPT-6 출시 예상: GPT-6라는 이름으로 언제 출시될지는 모르지만, GPT-4o보다 상당한 진보를 이룬 새로운 모델이 내년 1분기에 나올 것으로 예상된다.
- 개선 방향:
- 소비자: 소비자에게는 IQ 향상보다 다른 개선이 더 필요하다.
- 엔터프라이즈: 엔터프라이즈는 여전히 더 많은 IQ를 원한다.
- 목표: 모든 사람이 훨씬 더 좋아한다고 느끼는 모델을 만드는 것이 목표이다.
2. AI 인프라 구축 및 컴퓨팅 논리
2.1. 컴퓨팅의 잠재력과 과학적 발견
- 인프라 투자 규모: 약 1조 4천억 달러의 인프라 구축 약정이 있다.
- 컴퓨팅의 가치: 컴퓨팅 능력에 대해 사람들이 알게 된다면 훨씬 더 많은 컴퓨팅을 원할 것이며, 현재 대비 10배, 100배의 컴퓨팅 능력과 현재의 격차는 상당하다.
- 컴퓨팅 사용처 (개인적 관심사): 개인적으로 가장 기대하는 것은 AI와 막대한 컴퓨팅을 사용하여 새로운 과학을 발견하는 것이다.
- 과학적 발견의 중요성: 과학적 발견은 세상이 모두에게 더 나아지는 최고의 방법이라고 믿는다.
- 초기 단계의 발견: 현재 새로운 지식을 발견하는 데 막대한 컴퓨팅을 투입하고 있으며, 이는 매우 초기 단계이지만, 일단 시작되면 개선 방법을 알 수 있다.
2.2. 컴퓨팅을 활용한 제품 개발 및 규모 예측
- Sora 앱 개발 사례: 코덱스를 사용하여 Sora 안드로이드 앱을 한 달도 안 되어 구축했으며, 이때 엄청난 양의 토큰을 사용했다.
- 코덱스의 역할: 코덱스가 대부분의 작업을 처리했으며, 이는 더 나아가서 전체 회사가 많은 컴퓨팅을 사용하여 제품을 구축하는 것을 상상하게 한다.
- 미래 컴퓨팅 수요:
- 비디오 모델은 실시간으로 생성되는 사용자 인터페이스를 제시할 것이며, 이는 많은 컴퓨팅을 필요로 한다.
- 기업 변혁 및 개인 맞춤형 헬스케어(환자의 모든 징후를 지속적으로 측정) 역시 많은 컴퓨팅을 사용할 것이다.
- 현재 컴퓨팅 사용량 추정 (사고 실험):
- 현재 최전선 모델들이 하루에 생성하는 토큰 양은 약 10조 토큰 수준일 수 있다.
- 전 세계 80억 인구가 하루 평균 2만 토큰을 출력한다고 가정하면, 모델 제공업체의 출력 토큰이 전 인류의 출력 토큰보다 많아지는 시점을 예측할 수 있다.
- 비교의 의미: 이 비교는 다소 우스꽝스러울 수 있지만, 인류의 지적 연산과 AI의 지적 연산의 상대적 성장률을 가늠하게 해준다.
2.3. 컴퓨팅 수요의 확실성과 다차원적 개선
- 수요의 확실성: 현재 우리가 보는 모든 것은 수요가 발생할 것이라는 점에 기반하고 있다.
- 미래의 불확실성: 새로운 아키텍처 발견으로 10,000배의 효율성 증가가 발생하면 컴퓨팅을 과도하게 구축했을 수도 있다.
- 수요 증가의 근거: 모델이 빠르게 좋아지는 속도, 사용량 증가, 비용 절감 시 사용량 증가 등 모든 것이 수요가 계속 증가할 것임을 시사한다.
- 속도의 중요성: 단순히 하루에 처리할 수 있는 토큰 수가 아니라, 얼마나 빨리 처리할 수 있는지가 중요하다.
- 개선 차원: 미래에는 토큰 수뿐만 아니라 다른 차원에서도 개선이 있을 것이다.
- 모델 선택: 어려운 헬스케어 문제에 대해 5.2와 5.2 Pro 중 선택해야 한다면, 토큰이 훨씬 많이 들어도 더 나은 모델(Pro)을 선택할 것이다.
2.4. 과학계의 변화와 컴퓨팅 구축의 어려움
- 수학계의 반응: 수학자들은 LLM에 대해 회의적이었으나, GPT-4o가 경계를 넘게 했으며, 작은 증명이나 발견을 통해 작업 흐름이 바뀌고 있음을 최근에 확인했다.
- GPT-4o의 영향: GPT-4o 출시 5일 만에 수학 연구 커뮤니티에서 중요한 일이 일어났다는 인식이 생겼다.
- 컴퓨팅 구축의 어려움: 대규모 컴퓨팅은 매우 오랜 시간 전에 미리 계획해야 한다.
- 투자 및 성장률:
- 1.4조 달러는 매우 긴 기간에 걸쳐 지출될 것이다.
- 지난 1년 동안 컴퓨팅 규모는 약 3배 증가했으며, 내년에도 3배 증가를 목표로 한다.
- 수익 성장은 컴퓨팅 규모 성장과 대략적으로 일치하며, 현재까지 컴퓨팅을 수익화하지 못한 상황은 없었다.
2.5. 재무 구조 및 수익성 전망
- 재무 상황: 수익과 컴퓨팅 지출이 모두 증가하고 있으나, 컴퓨팅 지출이 수익 성장보다 앞서고 있다.
- 예상 손실: 보고된 수치에 따르면 OpenAI는 2028년 또는 2029년까지 약 1,200억 달러의 손실을 볼 것으로 예상되며, 그때 흑자 전환이 예상된다.
- 흑자 전환 계획: 수익이 증가하고 추론(inference)이 컴퓨팅 비용의 더 큰 부분을 차지하게 되면 훈련 비용을 흡수하게 될 것이다.
- 공격적 투자: 현재는 대규모 모델 훈련에 매우 공격적으로 투자하고 있기 때문에 훨씬 일찍 수익을 낼 수 있었음에도 불구하고 수익성이 늦어지고 있다.
- 수익과 지출의 관계: 2024년 매출 200억 달러 예상과 1.4조 달러 지출 약정 사이의 관계에 대해 명확히 설명할 필요가 있다.
- 지수적 성장 모델링의 어려움: 사람들은 지수적 성장에 대한 빠른 정신적 틀을 갖는 데 어려움을 겪는다.
- 성장 곡선 유지: OpenAI는 매우 가파른 수익 성장 곡선을 꽤 오랫동안 유지할 수 있다고 믿으며, 컴퓨팅 없이는 이 성장이 불가능하다.
- penciled this out : 연필로 적어봤다.
- 효율성 개선: 달러당 플롭스(flops per dollar) 측면에서 효율성이 개선될 것이다.
- 컴퓨팅의 생명선: 컴퓨팅은 이 모든 것을 가능하게 하는 생명선이며, 현재까지는 항상 컴퓨팅 부족 상태였다.
- 향후 전망: 컴퓨팅 제약이 항상 존재하겠지만, 시간이 지남에 따라 줄어들기를 바라며 구축한 것이다. 우리가 할 수 있는 훌륭한 비즈니스가 많아서.
- 재무 계획 요약: 훈련 비용은 전체적으로 증가하지만 비율은 감소할것이며, 엔터프라이즈 및 API를 통한 수익 성장으로 비용을 감당할 계획이다.
2.6. 부채 도입과 시장 반응에 대한 견해 spooked out : 겁먹었다
- 시장 우려: 시장이 최근 우려하는 지점은 부채(debt)가 방정식에 들어왔다는 점이다. 부채는 예측 가능한 것에 사용되는데, AI는 새로운 범주로 예측 불가능하다.
- 과거 시장 반응: 올해 초에는 특정 회사와 미팅 후 다음 날 주가가 15~20% 상승하는 것이 더 미친 일이었으며, 이는 불안정한 거품으로 향하고 있었다.
- 현재 시장의 합리성: 현재 시장에는 더 많은 회의론과 합리성이 생겨서 오히려 낫다고 본다.
- 인프라 가치: AI 인프라에서 가치가 나올 것이라는 점은 아무도 의문을 제기하지 않으므로, 부채가 이 시장에 들어오는 것은 합리적이다.
- 부채에 대한 두려움: 만약 모델 발전이 둔화되면 인프라 가치가 예상보다 낮아지고 데이터 센터가 청산될 수 있다는 두려움이 있다.
- 호황과 불황: 이러한 과정에서 호황과 불황이 있을 것이라고 예상한다.
- 모델 개선에 대한 확신: 모델이 훨씬 더 좋아질 것이라는 점은 회사를 걸고 베팅할 수 있을 만큼 명확하다.
- we have a good window into this 우리는 이 상황을 잘 들여다볼 수 있는 기회를 가지고 있습니다.
- 5.2의 경제적 가치: 모델이 5.2 수준에 멈춘다고 해도, 세상이 아직 그 가치를 완전히 파악하지 못했기 때문에 엄청난 추가 가치와 수익을 창출할 수 있다.
- 능력 과잉(Overhang)의 개념:
- 과거에는 단기/장기, 느린/빠른 이륙의 2x2 매트릭스를 생각했다.
- 현재는 작은 과잉/큰 과잉(small overhang/big overhang)이라는 Z축이 생겼다.
- 모델에 가치가 많더라도 세상이 그것을 배포하는 방법을 빨리 파악하지 못할 것이며, 대부분의 세계에서 과잉이 거대할 것으로 보인다.
- 이 거대한 과잉이 세상에 미칠 이상한 결과에 대해 아직 완전히 파악하지 못했다.
2.7. 능력 과잉과 워크플로우 변화의 어려움
- 기업의 ROI 문제: 모델이 훨씬 더 뛰어나지만, 많은 기업이 AI를 구현할 때 투자 수익(ROI)을 얻지 못하고 있다는 보고가 있다.
- 가치 인식의 모순: 일부 기업은 GPT-4o 가격을 10배 올려도 지불할 것이라고 말하며, 엄청난 가치를 얻고 있다고 한다.
- 코더들의 반응: 코더들은 가격을 100배 올려도 지불할 것이라고 말하며, 관료주의가 문제를 일으키는 것일 수 있다.
- 워크플로우 변화의 더딘 속도: GDP-Eval이 사실이라고 가정하면, 10번 중 7번은 5.2의 결과에 만족해야 하므로 많이 사용해야 하지만, 사람들은 워크플로우를 바꾸는 데 너무 오래 걸린다.
- 관성: 사람들은 여전히 주니어 분석가에게 덱(deck)을 만들라고 요청하는 것에 익숙하며, 이는 예상보다 더 고착적이다.
- 개인적 사용: 샘 알트먼 자신도 AI를 더 많이 사용할 수 있음에도 불구하고 여전히 비슷한 방식으로 워크플로우를 운영하고 있다.
3. 미래 제품 및 구조에 대한 논의
3.1. AI 디바이스 및 클라우드 전략
- 디바이스 관련 질문: 작업 중인 디바이스에 대해 질문하며, 화면이 없는 휴대폰 크기라는 소문에 대해 묻는다.
- 디바이스 제품군: 단일 기기가 아니며, 작은 기기군(small family of devices)을 출시할 것이다.
- 컴퓨팅 사용 방식의 변화: 시간이 지남에 따라 사람들의 컴퓨터 사용 방식이 멍청하고 반응적인 것에서 매우 스마트하고 능동적인 것으로 전환될 것이다.
- 기존 기기의 한계: 현재 기기들은 이러한 새로운 세상에 잘 맞지 않는다.
- 기기는 열려 있거나 닫혀 있을 수 있지만, 인터뷰에 집중하면서 동시에 질문을 속삭여주는 기능은 없다.
- 화면은 수십 년간 GUI를 지배해 온 방식에 사용자를 제한하며, 키보드는 정보 입력 속도를 늦추기 위해 만들어졌다.
- 새로운 가능성: 새로운 기능(AI)이 등장했으므로, 현재의 폼 팩터가 최적의 형태일 리는 없으며, 현재의 폼 팩터는 최적의 적합성이 아니다.
- 클라우드 사업: 청취자 이메일에서 Azure 대신 OpenAI와 직접 통합하여 수조 개의 토큰을 스택에 삽입하려는 움직임이 언급되었다.
- 엔터프라이즈 토큰 수요: 기업들은 OpenAI로부터 구매하고 싶은 토큰 양에 대해 명확히 밝혔으며, 2026년에도 수요를 충족시키지 못할 것이다.
- 엔터프라이즈 올인원 오퍼링: 기업들은 회사 이름과 AI를 연결하고, 맞춤형 API, ChatGPT Enterprise, 데이터 신뢰 플랫폼, 수조 개의 토큰 접근 능력 등을 원하지만, 현재는 훌륭한 올인원 서비스가 없다.
- AWS/Azure와의 비교: AWS나 Azure처럼 모든 서비스를 제공하는 야망은 없으며, 이는 다른 종류의 것이다.
- AI 플랫폼의 분리: 사람들은 기존의 웹 클라우드를 유지하고, 내부 운영 및 서비스 제공을 위한 별도의 AI 플랫폼을 가질 것으로 예상된다.
3.2. 과학적 발견의 시점과 진보의 속도
- 발견 시점 예측: 모델 또는 모델을 사용하는 사람들이 내년에 작은 발견을 하고, 5년 이내에 큰 발견을 할 것이라고 언급했다.
- 발견의 주체: 모델을 사용하는 사람들이 새로운 질문을 던지는 것이 중요하며, 도구의 가치가 인간의 질문에 의해 줄어들지는 않는다.
- 작은 발견의 시점 변화: 2026년에 시작될 것으로 예상했던 작은 발견들이 2025년 말에 시작되었다.
- 질적 변화: 작은 것이라도 무(nothing)와는 질적으로 매우 다르다.
- 큰 발견으로의 여정: 5년 후의 큰 발견으로의 여정은 AI의 정상적인 언덕 오르기와 같을 것이며, 매 분기 조금씩 나아지다가 갑자기 인간이 모델의 도움으로 5년 전에는 불가능했던 일을 하게 될 것이다.
3.3. IPO 계획 및 AGI(범용 인공지능) 정의 논의
- IPO 시점: 내년 IPO는 없을 것이다.
- 공개 기업의 장점과 단점:
- 공개 시장이 가치 창출에 참여하는 것은 멋지다.
- 이전 회사들에 비해 상장 시점이 매우 늦을 것이다.
- 비공개 기업으로 있는 것은 훌륭하지만, 많은 자본이 필요하며 곧 주주 한도를 초과할 것이다.
- 공개 기업 CEO가 되는 것에 대해서는 0% 흥분되지만, OpenAI가 공개 기업이 되는 것에 대해서는 일부는 흥분되고 일부는 짜증 날 것이다.
- GPT-4o의 지능 수준: GPT-4o가 거의 모든 면에서 인간보다 똑똑하다고 말한 것은 사실이며, 이는 AGI의 정의가 아닌가 하는 질문이 제기되었다.
- AGI의 의미: 현재 모델들은 원시적인 힘(raw horsepower) 기준으로는 매우 똑똑하지만, 오늘 할 수 없는 일을 내일 할 수 있도록 스스로 학습하는 능력이 없다.
- 지속적 학습의 중요성: 지속적인 학습은 유아가 할 수 있는 것으로, AGI에 중요한 부분이다.
- AGI에 대한 의견: 현재 모델 지능 수준에서 지속적 학습 능력이 있다면 분명히 AGI와 유사할 것이지만, 많은 사람은 현재 모델로도 AGI라고 말할 수 있다.
- AGI 용어의 모호성: AGI라는 용어는 매우 정의되지 않은 상태이며, OpenAI도 AGI를 명확히 정의하지 않은 채 지나쳐 버렸다.
- 초지능(Superintelligence) 정의 제안:
- AGI는 지나갔다고 간주하고, 다음 목표인 초지능에 집중하자.
- 초지능 후보 정의: AI 시스템이 인간(AI의 도움을 받더라도)보다 더 나은 미국 대통령, 대기업 CEO, 대규모 과학 연구소 운영자가 될 수 있을 때이다.
- 체스 비유: 체스에서 딥 블루 이후 인간과 AI의 협력이 AI 단독보다 나빴다가, 결국 인간의 이해 부족으로 인해 인간이 없는 순수한 AI가 가장 똑똑했던 것처럼, 초지능도 이와 유사한 프레임워크를 가질 수 있다.
3.4. 마무리 및 향후 인터뷰 예고
- 사용자 경험: 인터뷰 진행자는 3년 동안 제품을 사용해 왔으며, 개선 속도에 놀랐다고 언급한다.
- 감사 인사: 인터뷰 진행자는 샘 알트먼에게 개방적인 태도에 대해 감사를 표한다.
- 향후 콘텐츠 예고: 다음 인터뷰에는 Google DeepMind CEO 데미스 허사비스(Sergey Brin과 함께 출연 포함), Anthropic CEO 다리오 아모데이 등이 예정되어 있으며, 2026년에도 많은 인터뷰가 있을 예정이다.
댓글