Claude 4, Next Phase for AI Coding, and the Path to AI Coworkers
Claude 4, Next Phase for AI Coding, and the Path to AI Coworkers
트랜스크립트: https://www.assemblyai.com/playground/transcript/c38bdbab-3a97-4c16-9bd1-a4d2ff8d5023
번역: https://gemini.google.com/app/314e21db7b851a49
😗: 앤스로픽 클로드 4 모델의 핵심 개발자 중 한 명인 숄토 더글라스와 이야기를 나눌 수 있어 정말 즐거웠습니다. 이 모델들이 출시된 바로 그날, 저희는 개발자와 빌더들이 차세대 앤스로픽 모델에 대해 어떻게 생각해야 하는지를 포함하여 다양한 주제에 대해 이야기했습니다. 앞으로 6개월, 12개월, 그리고 2, 3년 후 이 모델들이 어떤 모습일지에 대한 추세선의 의미에 대해서도 논의했습니다. 신뢰할 수 있는 에이전트에 필요한 것은 무엇이며, 이 모델들이 코딩 분야에서 이미 이룬 발전을 의료 및 법률과 같은 분야에서도 언제쯤 재현할 수 있을지에 대해서도 심도 있게 다루었습니다. 그리고 정렬 연구(alignment research)에 대한 그의 견해, 즉 현재 우리의 위치, 효과적인 부분, 아직 해결해야 할 과제, 그리고 AI 안전에 대한 그의 반응에 대해서도 이야기했습니다. LLM 연구 분야의 뛰어난 석학과 나눈 정말 매혹적인 대화였습니다. 여러분도 분명 즐겁게 들으실 수 있을 겁니다. 그럼, 바로 숄토를 만나보시죠. 숄토, 팟캐스트에 참여해주셔서 정말 감사합니다.
🤓: 정말 반갑습니다. 초대해주셔서 영광입니다.
😗: 네, 이 작은 동굴 같은 스튜디오에 함께 해주셔서 감사합니다. 늘 즐겁네요. 이 팟캐스트가 공개될 때쯤이면 세상은 클로드 4를 경험하고 있을 겁니다. 많은 분들이 사용해 보시겠지만, 궁금한 점이 있습니다. 당신은 이 모델들을 가장 먼저 사용해 본 사람들 중 한 명인데요. 이 모델들의 어떤 점이 가장 기대되나요?
🤓: 네, 확실히 소프트웨어 엔지니어링 측면에서 또 한 단계 발전했습니다. 특히 오푸스(Opus)는 정말 놀라운 소프트웨어 엔지니어링 모델입니다. 점점 더, 저희의 거대한 모노레포(monorepo)에서 믿을 수 없을 정도로 불분명하게 명시된 작업을 요청했을 때, 모델이 정보를 발견하고, 문제를 파악하고, 테스트를 실행하는 등 상당히 자율적이고 독립적인 방식으로 작업을 수행하는 순간들을 경험하고 있습니다. 매번 감탄하게 됩니다.
😗: 새로운 모델 세트가 나올 때마다, 우리는 무엇이 효과가 있고 무엇이 그렇지 않은지에 대한 저희의 사고방식(멘탈 모델)을 재정립해야 합니다. 이번 도약으로 인해, 코딩할 때 이 모델들을 어떤 용도로 사용하고 사용하지 않는지에 대한 당신의 모델은 어떻게 바뀌었나요?
🤓: 가장 큰 변화는 작업의 시간 범위(time horizon)가 조금 확장되었다는 점입니다. 모델 능력 향상은 두 가지 축으로 특징지을 수 있다고 생각합니다. 하나는 작업의 절대적인 지적 복잡성이고, 다른 하나는 모델이 의미 있게 추론할 수 있는 컨텍스트의 양 또는 연속적인 행동의 양입니다. 이 새로운 모델들은 두 번째 축에서 상당히 개선된 느낌입니다. 여러 행동을 취하고 환경에서 어떤 정보를 가져와야 하는지 파악한 다음, 그에 따라 행동할 수 있는 능력이 정말 뛰어납니다. 마치 시간 범위가 늘어난 것과 같습니다. 또한 핵심 코드나 이런 종류의 지원도 마찬가지입니다. 이제 유용한 방식으로 이를 수행할 수 있는 모든 도구에 접근할 수 있게 되었고, 채팅창에서 복사 붙여넣기 하는 것과 같은 작업을 하지 않아도 된다는 점은 그 자체로 매우 의미 있는 개선입니다. 이전에는 한 시간 이상, 혹은 몇 시간이 걸렸을 다양한 작업들이 이제 제 앞에서 척척 진행되는 것을 봅니다. 인간의 작업 시간으로 환산하면 엄청난 거죠.
😗: 이 팟캐스트가 나올 때쯤이면 사람들이 처음으로 이 모델들을 접하게 될 텐데요. 그들이 가장 먼저 시도해봐야 할 것에 대한 조언이 있다면 무엇일까요?
🤓: 가장 먼저 시도해봐야 할 것은, 솔직히 말해서, 자신의 업무에 바로 적용해 보는 것입니다. 그게 가장 중요합니다. 앉아서 그날 코드베이스에서 가장 먼저 하려고 했던 바로 그 작업을 모델에게 시켜보세요. 그리고 모델이 어떤 정보를 가져와야 하는지 파악하고 무엇을 해야 할지 알아내는 과정을 지켜보십시오. 아마 상당히 깊은 인상을 받으실 겁니다.
😗: 네, 이제 이런 새로운 기능들을 갖게 되셨으니, 분명 이 모델들 위에 수많은 사람들이 무언가를 만들고 있을 텐데요. 이 모델들을 가지고 애플리케이션을 만드는 빌더들에게 새롭게 가능해지기를 바라는 것은 무엇인가요?
🤓: 어떤 면에서는 '제품의 기하급수적 발전(product exponential)'이라는 개념이 있다고 생각합니다. 모델의 능력보다 항상 한발 앞서서 제품을 만들어야 한다는 것이죠. 저는 커서(Cursor), 윈드서프(Windsurf), 데빈(Devin)과 같은 제품들을 예로 들어 생각하곤 합니다. 커서를 보면, 그들은 모델의 능력이 도달하기 훨씬 이전부터 코딩의 미래에 대한 비전을 가지고 있었습니다. 한동안 커서는 클로드 3.5 소네트(Claude 3.5 Sonnet)와 같은 기본 모델이 성공하여 그들이 사람들에게 제공하고자 했던 지원이 실현될 수 있을 때까지 PMF(Product-Market Fit, 시장 적합성)를 달성하지 못했습니다. 그리고 윈드서프는 제 생각에 훨씬 더 에이전트적인(agentic) 방향으로 나아갔습니다. 이를 통해 그들은 제품의 기하급수적 발전에 더욱 힘을 쏟음으로써 상당한 시장 점유율을 확보할 수 있었습니다. 현재 클로드 코드(Claude code)뿐만 아니라 새로운 클로드 깃허브(Claude GitHub) 통합, OpenAI의 코덱스(Codex), 그리고 구글의 코딩 에이전트 등 모두가 정말로 코딩 에이전트를 만들고 있습니다. 이건 마치 보석과 같아요.
😗: 맞아요, 보석들이죠.