🌍🚀세계 최초 하이브리드 추론 모델 Claude 3.7 Sonnet과 Claude Code 분석

안녕하세요! 오늘은 Anthropic에서 새롭게 공개한 최신 인공지능 모델, Claude 3.7 Sonnet과 코드 개발을 위한 AI 도구 Claude Code에 대해 살펴보겠습니다. Claude 3.7 Sonnet은 시장 최초의 하이브리드 추론 모델로, 빠른 응답과 심층적인 사고를 동시에 제공하는 혁신적인 AI입니다. 특히 사용자는 추론 예산을 직접 조정하여 답변의 품질과 속도를 조절할 수 있습니다. Claude Code는 개발자가 터미널에서 직접 AI를 활용하여 코딩 생산성을 극대화할 수 있도록 돕는 명령줄 도구로서, 현재 연구 프리뷰(베타)로 제공되며, 코드 편집, 버그 수정, 테스트 실행 등 다양한 기능을 지원합니다. 이번 블로그에서는 Claude 3.7 Sonnet과 Claude Code의 특징과 주요 기능, 그리고 벤치마크 결과 및 사용방법을 살펴보겠습니다.

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

1. Claude 3.7 Sonnet 및 Claude Code 개요

Anthropic은 2025년 2월 24일에 Claude 3.7 Sonnet과 Claude Code를 발표했습니다. Claude 3.7 Sonnet은 Anthropic의 최신 지능형 모델이며, 시장 최초의 하이브리드 추론 모델입니다. 이 모델은 즉각적인 응답과 단계별 심층 사고를 모두 제공할 수 있으며, API 사용자는 모델이 사고하는 데 소요되는 시간을 세밀하게 제어할 수 있습니다. Claude Code는 에이전트 코딩을 위한 명령줄 도구로, 개발자가 터미널에서 직접 Claude에게 상당한 엔지니어링 작업을 위임할 수 있도록 합니다. Claude Code는 현재 제한된 연구 미리 보기로 제공됩니다.

Claude 3.7 Sonnet은 무료, Pro, Team, Enterprise를 포함한 모든 Claude 요금제와 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI에서 사용할 수 있습니다. 확장 사고 모드는 무료 티어를 제외한 모든 곳에서 사용할 수 있습니다. 표준 및 확장 사고 모드 모두에서 Claude 3.7 Sonnet의 가격은 이전 모델과 동일하게 입력 토큰 100만 개당 3달러, 출력 토큰 100만 개당 15달러입니다. 여기에는 생각 토큰이 포함됩니다.

https://www.anthropic.com/news/claude-3-7-sonnet

Claude 3.7 Sonnet and Claude Code

Today, we’re announcing Claude 3.7 Sonnet, our most intelligent model to date and the first hybrid reasoning model generally available on the market.

www.anthropic.com

2. Claude 3.7 Sonnet 및 Claude Code 특징과 주요 기능

Claude 3.7 Sonnet은 다른 추론 모델과는 달리, 인간이 빠른 응답과 심층적인 사고에 하나의 두뇌를 사용하는 것처럼, 추론을 별도의 모델이 아닌 통합된 기능으로 제공합니다. 이러한 통합 접근 방식 덕분에 사용자는 더욱 자연스럽고 원활한 경험을 제공합니다. Claude 3.7 Sonnet은 다음과 같은 특징을 가지고 있습니다:

단일 모델: Claude 3.7 Sonnet은 일반적인 LLM과 추론 모델을 하나로 결합합니다. 사용자는 모델이 정상적으로 응답할지, 아니면 응답하기 전에 더 오래 생각할지를 선택할 수 있습니다. 표준 모드에서 Claude 3.7 Sonnet은 Claude 3.5 Sonnet의 업그레이드 버전입니다. 확장 사고 모드에서는 응답하기 전에 자체적으로 검토하여 수학, 물리학, 명령어 추종, 코딩 및 기타 여러 작업에서 성능을 향상시킵니다.
추론 예산 제어: API를 통해 Claude 3.7 Sonnet을 사용하는 사용자는 추론 예산을 제어할 수 있습니다. 사용자는 Claude에게 N개의 토큰 이하로 생각하도록 지시할 수 있으며, N의 값은 최대 출력 제한인 128,000 토큰까지 가능합니다. 이를 통해 사용자는 답변의 품질을 위해 속도(및 비용)을 절충할 수 있습니다.
실제 작업 최적화: Anthropic은 추론 모델을 개발할 때 수학 및 컴퓨터 과학 경시대회 문제에 대한 최적화보다는 기업이 실제로 LLM을 사용하는 방식을 더 잘 반영하는 실제 작업에 초점을 맞췄습니다.

1) 확장 사고 모드(Extended Thinking Mode)

Claude 3.7 Sonnet에서 확장 사고 모드는 모델이 더 어려운 질문에 대해 더 깊이 생각할 수 있도록 하는 기능입니다. 이 모드는 빠른 응답과 심층적인 사고를 단일 모델에서 통합한 것으로, 사용자는 필요에 따라 모델이 답변하기 전에 더 오래 생각하도록 지시할 수 있습니다.

확장 사고 모드의 특징은 다음과 같습니다:

사고 과정 가시화: Claude가 어떻게 생각하는지 관찰할 수 있어 답변을 이해하고 검증하는 데 도움이 됩니다. 이는 모델이 내부적으로 생각하는 것과 외부적으로 말하는 것 사이의 모순을 파악하여 기만과 같은 우려되는 행동을 식별하는 데 사용될 수 있습니다.
에이전트 기능 향상: 확장 사고는 Claude가 기능을 반복적으로 호출하고, 환경 변화에 대응하며, 열린 결말의 작업을 완료할 수 있도록 합니다. 예를 들어, 가상 마우스 클릭과 키보드 입력을 통해 사용자를 대신하여 컴퓨터를 사용할 수 있습니다.
안전장치: 잠재적으로 유해한 콘텐츠가 포함된 경우 사고 과정이 암호화되어 사용자에게 표시되지 않습니다. 또한 프롬프트 주입 공격을 방어하기 위한 안전 조치가 강화되었습니다.

Claude의 확장 사고는 수학, 물리학, 코딩 등 다양한 작업에서 성능을 향상시키며, Claude가 여러 전략을 시도하고 이전 가정을 의심하여 자체 역량을 향상시키는 데 도움이 됩니다. Claude 3.7 Sonnet의 확장 사고 모드는 무료 티어를 제외한 Claude Pro, Team, Enterprise 및 API 사용자에게 제공됩니다.

2) 클로드 코드(Claude Code)

Claude Code는 터미널 기반 에이전트 코딩 도구로, 현재 연구 프리뷰(베타) 버전으로 제공되고 있습니다. Claude Code는 사용자의 코드베이스를 이해하고 자연어 명령을 통해 더 빠르게 코딩할 수 있도록 지원하며, 개발 환경과 직접 통합되어 추가 서버나 복잡한 설정 없이 워크플로우를 간소화합니다. Claude Code의 주요 기능은 다음과 같습니다:

코드베이스 전체에서 파일 편집 및 버그 수정
코드 아키텍처 및 로직에 대한 질문 응답
테스트 실행 및 수정, 린팅(잠재적 오류나 스타일 문제 검사) 및 기타 명령 실행
git 기록 검색, 병합 충돌 해결, Commit 및 Pull Request 생성

Claude Code의 특징은 다음과 같습니다.

코드 보안: 쿼리는 중간 서버 없이 Anthropic API로 전송되며, 프로젝트 구조를 인식하고 실제 작업을 수행합니다.
다양한 작업 수행: 코드베이스에 대한 질문, 커밋 생성, 문제 해결 등 다양한 작업을 수행할 수 있습니다.
명령어 제어: CLI 명령어와 슬래시 명령어를 사용하여 Claude Code를 제어할 수 있습니다. 예를 들어, /bug 명령어를 사용하여 버그를 보고하거나 /clear 명령어로 대화 기록을 지울 수 있고, /cost 명령어를 사용하여 토큰 사용량을 확인할 수 있습니다.
권한 관리: 파일 읽기, Bash 명령어 실행, 파일 수정 등 작업 유형에 따라 권한 승인이 필요합니다.

Claude Code를 사용하면 코드베이스를 더 잘 이해하고, Git 작업을 자동화하고, 코드를 지능적으로 편집하고, 테스트 및 디버깅 작업을 수행할 수 있습니다. Claude Code는 개발자가 AI와 협력하여 코딩 생산성을 향상시키는 데 도움이 되는 강력한 도구입니다.

https://console.anthropic.com/code/welcome

Anthropic Console

console.anthropic.com

3. Claude 3.7 Sonnet 벤치마크 결과

다음은 Claude 3.7 Sonnet의 벤치마크 결과에 대해 알아보겠습니다. Claude 3.7 Sonnet은 아래 그래프에서와 같이 AI 모델의 실제 소프트웨어 문제 해결 능력을 평가하는 SWE-bench Verified에서 DeepSeek R1과 OpenAI o3-mini를 능가하는 최첨단 성능을 달성했습니다.

또한 Claude 3.7 Sonnet은 사용자 및 도구 상호 작용을 통해 리테일이나 항공 관련 복잡한 실제 작업을 수행하는 AI 에이전트를 테스트하는 프레임워크인 TAU-bench에서도 최첨단 성능을 달성했습니다.

Claude 3.7 Sonnet은 명령어 추종, 일반 추론, 다중 모드 기능 및 에이전트 코딩에서 탁월하며, 아래 표에서 보듯이 확장 사고는 수학 및 과학에서 괄목할 만한 향상을 제공합니다. 다만, Grok3나 DeepSeek R1, o3-mini High 모델의 성능을 앞서지는 못한 것으로 보입니다.

Claude 3.7 Sonnet 일반 모델과 확장 사고 모델의 벤치마크 결과

Claude 3.7 Sonnet은 전반적으로 고급 추론, 멀티모달 이해, 수학적 문제 해결, 그리고 실세계 도구 사용에서 강력한 성능을 발휘하는 AI 모델로 평가됩니다.

4. Claude 3.7 Sonnet 및 Claude Code 사용방법

Claude 3.7 Sonnet은 https://claude.ai/new 에서 사용하실 수 있습니다.

Claude Code를 사용해 보려면 다음 단계를 고려해야 합니다.

Claude Code는 현재 제한된 연구 미리 보기로 제공 중입니다. 모든 사람이 바로 사용할 수 있는 것은 아닙니다. Claude Code를 사용하려면 접근 권한을 신청해야 할 수 있습니다.
대기자 명단 등록: Claude Code는 현재 용량 제한이 있으므로, 다음 링크에서 대기자 명단에 등록해야 합니다. https://console.anthropic.com/code/welcome 접근 권한이 부여되면 아래와 같이 이메일로 알림이 전송됩니다.

시스템 요구 사항 확인: Claude Code를 사용하기 전에 운영 체제, 하드웨어, 소프트웨어 및 네트워크 요구 사항을 충족하는지 확인해야 합니다.
- 운영 체제: macOS 10.15+, Ubuntu 20.04+/Debian 10+, 또는 WSL을 통한 Windows
- 하드웨어: 최소 4GB RAM
- 소프트웨어: Node.js 18+, git 2.23+ (선택 사항), GitHub 또는 GitLab CLI (PR 워크플로에 필요한 경우), ripgrep (rg) (향상된 파일 검색에 필요한 경우)
- 네트워크: 인증 및 AI 처리를 위한 인터넷 연결
Claude Code 설치: 터미널에서 다음 명령어를 실행하여 Claude Code를 설치합니다.
```
npm install -g @anthropic-ai/claude-code
```

프로젝트 탐색: 터미널에서 프로젝트 디렉토리로 이동합니다.
```
cd your-project-directory
```
Claude Code 실행: 터미널에서 claude 명령어를 실행하여 Claude Code를 시작합니다.
```
claude
```

인증 완료: Console 계정으로 일회성 OAuth 프로세스를 완료합니다. console.anthropic.com에서 활성 결제가 필요하며, 최소 5달러 결제가 필요할 수 있습니다.

Claude Code의 CLI 명령어는 다음과 같습니다.

claude: 대화형 REPL(Read-Eval-Print Loop)을 시작합니다. 
claude "query": 초기 프롬프트와 함께 REPL을 시작합니다. 예를 들어, claude "explain this project"는 프로젝트에 대한 설명을 요청하는 프롬프트로 시작합니다. 
claude -p "query": 일회성 쿼리를 실행한 다음 종료합니다. 예를 들어, claude -p "explain this function"은 특정 함수에 대한 설명을 요청하고 종료합니다. 
cat file | claude -p "query": 파이프된 콘텐츠를 처리합니다. 예를 들어, cat logs.txt | claude -p "explain"은 logs.txt 파일의 내용을 Claude에게 전달하여 설명을 요청합니다. 
claude config: 설정을 구성합니다. 예를 들어, claude config set --global theme dark는 전역 테마를 어둡게 설정합니다. 
claude update: 최신 버전으로 업데이트합니다. 
claude mcp: MCP(Model Context Protocol) 서버를 구성합니다. 예를 들어, claude mcp add pyright_lsp는 pyright_lsp를 추가합니다. 
--print: 상호 작용 모드 없이 응답을 출력합니다. 
--verbose: 자세한 로깅을 활성화합니다. 
--dangerously-skip-permissions: 권한 프롬프트를 건너뜁니다 (인터넷이 없는 Docker 컨테이너에서만 해당).

Claude Code에서 사용할 수 있는 슬래시 명령어는 아래와 같습니다.

/bug: 버그를 보고합니다. (Anthropic에 대화 내용 전송)
/clear: 대화 기록을 지웁니다. 
/compact: 컨텍스트 공간을 절약하기 위해 대화를 압축합니다.
/config: 구성을 보고 수정합니다. 
/cost: 토큰 사용량 통계를 표시합니다.
/doctor: Claude Code 설치 상태를 확인합니다. 
/help: 사용법 도움말을 얻습니다. 
/init: CLAUDE.md 가이드로 프로젝트를 초기화합니다. 
/login: Anthropic 계정을 전환합니다. 
/logout: Anthropic 계정에서 로그아웃합니다. 
/pr_comments: 풀 리퀘스트 코멘트를 봅니다. 
/review: 코드 검토를 요청합니다. 
/terminal-setup: Shift+Enter 키 바인딩을 새 줄에 설치합니다 (iTerm2 및 VSCode만 해당).

Claude Code는 터미널에서 직접 작동하여 프로젝트 컨텍스트를 이해하고 실제 작업을 수행합니다. 파일을 수동으로 컨텍스트에 추가할 필요 없이 Claude가 필요에 따라 코드베이스를 탐색합니다. Claude Code는 기본적으로 claude-3-7-sonnet-20250219를 사용합니다.

5. Claude 3.7 Sonnet 성능 테스트

다음은 Claude 3.7 Sonnet의 코딩, 수학, 추론 성능을 테스트해 보겠습니다. 코딩은 코딩 교육 사이트 edabit.com의 Python, JavaScript, C++ 문제로 테스트하고, 수학 문제는 기하학, 확률, 수열, 최적화, 복합 문제 등으로 구성된 6개의 문제, 정보올림피아드 추론 문제 6문제이고, 모든 답은 재시도 없이 첫 번째 시도의 채점 결과를 그대로 반영하였습니다.

1) 코딩 테스트

Claude 3.7 Sonnet	Medium	Hard	Very Hard	Expert
Python	Pass	Pass	Pass	Pass
JavaScript	Pass	Pass	Pass	Pass
C++	Pass	Pass	Pass	Fail

코딩 테스트 결과 Claude 3.7 Sonnet은 C++ Expert 난이도를 제외하고 모든 난이도 문제를 성공하였습니다.

2) 수학 테스트

No.	문제 구분	문제	Claude 3.7 Sonnet
1	기초 대수 문제	두 숫자 x와 y가 있습니다. 이들이 만족하는 식은 3x+4y=12이며, x−2y=1입니다. x와 y의 값을 구하세요	Pass
2	기하학 문제	반지름이 7cm인 원의 넓이를 구하세요. π=3.14159로 계산하세요.	Pass
3	확률 문제	주사위를 두 번 던졌을 때, 두 숫자의 합이 7이 될 확률을 구하세요.	Pass
4	수열 문제	첫 번째 항이 3이고, 공차가 5인 등차수열의 10번째 항을 구하세요.	Pass
5	최적화 문제	어떤 직사각형의 둘레가 36cm입니다. 이 직사각형의 넓이를 최대화하려면 가로와 세로의 길이는 각각 얼마여야 하나요?	Pass
6	복합 문제	복소평면에서 다음 극한값을 구하시오. lim[n→∞] (1 + i/n)^(n^2) 여기서 i는 허수단위 (i^2 = -1)입니다.	Pass

3) 추론 테스트

No.	문제	Claude 3.7 Sonnet
1	5학년과 6학년 학생 160명이 나무 심기에 참가하였습니다. 6학년 학생들이 각각 평균5그루,5학년 학생들이 각각 평균 3그루씩 심은 결과 모두 560그루를 심었습니다. 나무심기에 참가한 5,6학년 학생은 각각 몇명일까요?	Pass
2	베티는 새 지갑을 위해 돈을 모으고 있습니다. 새 지갑의 가격은 $100입니다. 베티는 필요한 돈의 절반만 가지고 있습니다. 그녀의 부모는 그 목적을 위해 $15를 주기로 결정했고, 할아버지와 할머니는 그녀의 부모들의 두 배를 줍니다. 베티가 지갑을 사기 위해 더 얼마나 많은 돈이 필요한가요?	Pass
3	전국 초등학생 수학경시대회가 열렸는데 영희,철수,진호 세사람이 참가했습니다. 그들은 서울,부산,인천에서 온 학생이고 각각 1등,2등,3등 상을 받았습니다. 다음과 같은 사항을 알고 있을때 진호는 어디에서 온 학생이고 몇등을 했습니까? 1) 영희는 서울의 선수가 아닙니다. 2) 철수는 부산의 선수가 아닙니다. 3)서울의 선수는 1등이 아닙니다. 4) 부산의 선수는 2등을 했습니다. 5)철수는 3등이 아닙니다.	Pass
4	방 안에는 살인자가 세 명 있습니다. 어떤 사람이 방에 들어와 그중 한 명을 죽입니다. 아무도 방을 나가지 않습니다. 방에 남아 있는 살아있는 살인자는 몇 명입니까? 단계별로 추론 과정을 설명하세요.	Pass
5	A marble is put in a glass. The glass is then turned upside down and put on a table. Then the glass is picked up and put in a microwave. Where's the marble? Explain your reasoning step by step.	Pass
6	도로에 5대의 큰 버스가 차례로 세워져 있는데 각 차의 뒤에 모두 차의 목적지가 적혀져 있습니다. 기사들은 이 5대 차 중 2대는 A시로 가고, 나머지 3대는 B시로 간다는 사실을 알고 있지만 앞의 차의 목적지만 볼 수 있습니다. 안내원은 이 몇 분의 기사들이 모두 총명할 것으로 생각하고 그들의 차가 어느 도시로 가야 하는지 목적지를 알려 주지 않고 그들에게 맞혀 보라고 하였습니다. 먼저 세번째 기사에게 자신의 목적지를 맞혀 보라고 하였더니 그는 앞의 두 차에 붙여 놓은 표시를 보고 말하기를 "모르겠습니다." 라고 말하였습니다. 이것을 들은 두번째 기사도 곰곰히 생각해 보더니 "모르겠습니다." 라고 말하였습니다. 두명의 기사의 이야기를 들은 첫번째 기사는 곰곰히 생각하더니 자신의 목적지를 정확하게 말하였습니다. 첫번째 기사가 말한 목적지는 어디입니까?	Pass

Claude 3.7 Sonnet은 추론 성능 테스트 문제를 모두 성공하였습니다.

Claude 3.7 Sonnet의 테스트를 이전 블로그의 Grok-3, o3-mini, DeepSeek-R1과 비교한 종합결과는 다음과 같습니다.

구 분	코딩 테스트 결과	수학 테스트 결과	추론 테스트 결과	평균
Claude 3.7 Sonnet	91.67	100	100	97.22
Grok-3	100	100	100	100
o3-mini	91.67	100	83.33	91.67
DeepSeek-R1	100	100	100	100

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

6. 맺음말

Claude 3.7 Sonnet과 Claude Code는 AI의 새로운 가능성을 제시하는 강력한 도구입니다. Claude 3.7 Sonnet은 하이브리드 추론 모델을 통해 빠른 응답과 심층적인 사고를 동시에 제공하며, 사용자 맞춤형 추론 예산 조정 기능으로 더욱 효율적인 활용이 가능합니다. 또한, Claude Code는 개발자가 명령줄 환경에서 직접 AI의 도움을 받아 코드 작성, 버그 수정, 테스트 실행 등을 수행할 수 있도록 지원하며, 코딩 생산성을 극대화하는 혁신적인 도구로 자리 잡을 것으로 기대됩니다.

여러분도 한 번씩 Claude 3.7 Sonnet 모델을 경험해 보시길 추천드리면서, 저는 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다.

2025.02.15 - [AI 도구] - [무료!]🔍🤖📚DeepSeek/Gemini로 Open Deep Research 만들기

[무료!]🔍🤖📚DeepSeek/Gemini로 Open Deep Research 만들기

안녕하세요! 오늘은 최근 공개된 OpenAI의 Deep Research기능을 무료로 구현해 보겠습니다. Open Deep Research는 DeepSeek과 Gemini 모델을 통해 특정 주제에 대한 웹 데이터를 수집하고, 이를 구조적이고 체

fornewchallenge.tistory.com

저작자표시 (새창열림)

'AI 언어 모델' 카테고리의 다른 글

🐪🤖 QwQ-Max-Preview: 알리바바의 최신 추론 모델 심층 분석 ! (10)	2025.03.05
📹🚀🔓Wan2.1: Sora보다 강력한 알리바바의 최강 오픈소스 비디오 AI (7)	2025.03.03
🔍🤖 Grok-3: 일론 머스크가 극찬한 "지구에서 가장 똑똑한 AI 챗봇" (4)	2025.02.19
🐋DeepSeek-VL2: 고급 멀티모달 이해를 위한 MoE 비전-언어 모델 (6)	2025.02.09
✨Gemini 2.0 패밀리: 최대 200만 토큰 지원하는 구글의 최신 AI 모델군 (4)	2025.02.07