본문 바로가기
IT,SW,Data,Cloud,AI/AI and more

Youtube Memo - Andrej Karpathy: Software Is Changing (Again)

by 착실하게 2025. 8. 29.
반응형

https://youtu.be/LCEmiRjPEtQ?si=KbhZJxhl8VymB4CS

 
Andrej Karpathy's keynote on June 17, 2025 at AI Startup School in San Francisco.
 
소프트웨어는 변하고 있다. 또 다시.
70년 동안 거의 안 변하다가 최근 몇 년 사이에 두번 엄청 급격히 변했다. 
 
SW 1.0 - computer code that programs a computer (예: 파이썬으로 코딩을 함)
SW 2.0 - weights which program neural networks. Fixed function neural net. (예: 데이터를 만지고 던져 줌. positive examples, negative examples 넣고 encoding 던져 주고 훈련 시키면 파라메터가 나오는 등 )
SW 3.0 - neural networks became programmable with LLMs. (영어로 프롬프트를 던져준다. you are a sentiment classifier. 등 넌 뭐다, 답변 형태를 이렇게 해라. example도 알려주고. 등등 )

realm of Github 시각화 볼 수 있음.
많은 깃헙코드 이제 코드가 아님. there's a bunch of English interspersed with code. 새로운 종류의 코드가 생기는 중이라고 본다.

The hottest new programming language is English.


테슬라 자율주행 만들던 당시, 1.0 코드 C++ 있던게 인공신경망 코드로 대체되어가면서 C++점점 들어내게 되었고, 이제는 prompt to LLMs가 1.0과 2.0을 잡아먹고 있음.

3가지 다 잘할줄 아는게 좋음. 장단점이 각각 달라서.

LLMs as utilities, fabs, and operating systems.


앤드류 응 "AI is the new electricity" 라고 했는데 실제로 이제 유틸리티 같아짐. 유틸리티의 속성들을 AI가 가지고 있음.
- CAPEX to train an LLM
- OPEX to serve intelligence over increasingly homogeneous API
- metered access (ppl pay per token)
- utility-like Demands (for low latency, high uptime, consistent quality, etc)

하지만 가장 어울리는 비유는 OS라고 생각함. 생태계가 있고.. 윈도우, 맥, 리눅스 등이 있고.

그리고 1960년대 컴퓨터랑 AI랑 비슷함.
당시에 여러명이 타임쉐어해서 썼던 것 처럼, AI도 아직 너무 비싸서, 클라우드에 있는 ai를 thin client들이 쉐어해서 쓰는 중.

그런데 세상을 바꾼 다른 기술들과 AI가 다른 점은 diffusion에 있음. 보통 비싸다 보니 정부(특히 방산 관련), 회사에서 먼저 사용하고 일반 사용자들에게로 퍼지는데, AI는 일반 사용자들이 먼저 쓰고 있음. 달걀 삶는 방법 문의 등. 정부와 회사가 adoption에 뒤쳐지고 있음.

우리가 LLM을 프로그래밍 하기 전에, 우리는 이런게 뭔지 생각할 시간이 필요하다. 난 그들의 심리에 대해 얘기하는 종류를 특히 좋아한다.

LLM은 people, spirits 같음. stochastic 스토캐스틱 simulation of people임.
이 케이스에서 시뮬레이터는 auto-regressive transformer임. 트랜스포머는  뉴럴 넷임.

이 시뮬레이터는 인간을 학습시킨 거라서 심리가 있다.
그리고 perfect memory도 가지고 있음. 레인맨 영화에서처럼.
더스틴 호프만 같음.
그 어떤 인간보다도 많은걸 알고 있음.
하지만 인지결함도 있음. 할루시네이션, jagged intelligence (9.11이 9.9보다 크다고 말하는), Anterograde Amnesia (LLMs don't learn over time) (마치 메멘토 처럼),
그리고 보안적 제한도 있음. 속이기 쉬움.데이터 leak라던지.

기회들
어떻게 잘 활용해볼까?

partial autonomy apps
Cursor사용. 챗지피티에 바로 가는게 아니라 (마치 OS에 바로 집어넣는 것임) 대신에 커서 사용하기.

왼편이 전통적 인터페이스 (직접 옛날처럼 수작업 가능), 오른편이 LLM integration (청크에 들어가게 해줌)

LLM app의 속성 중 공통적이고, 유용한 것: LLM이 맥락 관리를 해준다. 멀티플 호출을 오케스트레이트 해준다.

Autonomy Slider. AI의 자율성 정도를 인간이 조절함.

퍼플렉시티 사례.

인간을 위해 디자인된 SW들이 이제는 모두 LLM 접근 가능하게 변화되어야 한다.

AI와 협동: 그들이 생성, 인간이 verification. 이 반복 빨리 해서 많은 일 해내기.
1) spped up verification 하는 방법
2) AI에 leash채우기. AI가 빠르게 잘 해도 인간이 병목이다. 빠르게 하는 방법 찾으면서도 컨트롤 가져가는 방법 찾기.

교육에 관심 있다.
선생님용 앱과 학생용 앱.

자율주행 사례.
2013년에 금방 될줄. 하지만 아직 하고있음.
웨이모에 운전자 없어보이지만 여전히 인간이 있음.

2025년이 에이전트의 해 라고 하지만 난 에이전트의 십년이라고 본다. 인간개입이 여전히 계속 loop속에 많이 필요함.

Vibe Coding 개념.
building a project but it's not really coding I just see stuff, say stuff, run stuff, and copy past stuff

 Build for agents
Humans (GUI), Computers (API), agents!

Documentation이 현재는 자연어로 쓰여있지만 LLM에게 쉽게 accessible하지 않음. Vercel and Stripe는 도큐멘테이션을 LLM용으로 빠르게 변화시킨 사례임. Markdown형태로 바꿈.
깃헙도 LLM이 소화하기 어려운 인간의 형태임. 깃헙코드를 gitingest.com에 가면 이걸 LLM에게 그냥 복사해서 던져줄 수 있는 형태로 바꿀 수 있음.

 
 

반응형

댓글