안녕하세요! 오늘은 중국의 AI 연구소 DeepSeek에서 발표한 최신 대규모 언어 모델, DeepSeek V3-0324에 대해 살펴보겠습니다. DeepSeek V3-0324는 2024년 3월 24일에 공개된 새로운 체크포인트 모델로, 이전 DeepSeek V3 모델을 업데이트한 버전입니다. 특히, MIT 라이선스로 배포되어 상업적 활용이 가능하다는 점에서 큰 주목을 받고 있습니다.
이번 블로그에서는 DeepSeek V3-0324의 개요, 특징 및 주요 기능, 벤치마크 결과를 살펴보고, 실제로 코딩, 수학, 추론 성능을 테스트해 보겠습니다. 언어 모델의 한 획을 그은 DeepSeek의 성능이 얼마나 개선되었는지 확인하러 가보실까요?
"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
1. DeepSeek V3-0324 개요
중국의 AI 연구소인 DeepSeek에서 2024년 3월 24일에 새로운 대규모 언어 모델(LLM) 체크포인트인 DeepSeek V3-0324를 공개했습니다. 이 모델은 이전 버전인 DeepSeek V3 모델을 업데이트한 버전으로, MIT 라이선스로 배포되어 상업적인 이용이 가능하다는 점이 특징입니다. 이전 DeepSeek V3 모델은 자체적인 라이선스를 가지고 있었던 것과 비교하면 새로운 변화입니다.
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main
deepseek-ai/DeepSeek-V3-0324 at main
Add files using upload-large-folder tool f6be68c verified about 14 hours ago
huggingface.co
DeepSeek V3-0324라는 이름에는 모델 출시일인 03월 24일이 포함되어 있습니다. 모델 출시와 함께 별도의 공식적인 정보 발표는 없었으나, Reddit 등 온라인 커뮤니티를 중심으로 초기 사용 후기들이 공유되며 높은 관심을 받고 있습니다.
https://www.reddit.com/r/LocalLLaMA/comments/1jip611/deepseek_releases_new_v3_checkpoint_v30324/
From the LocalLLaMA community on Reddit: Deepseek releases new V3 checkpoint (V3-0324)
Explore this post and more from the LocalLLaMA community
www.reddit.com
DeepSeek V3-0324는 완전한 오픈 소스 모델로 Hugging Face를 통해 모델 가중치를 다운로드하여 직접 사용할 수 있으며, OpenRouter를 통해서도 무료 API를 통해 접근할 수 있습니다. 일부에서는 이 업데이트된 V3-0324 모델이 향후 4월 또는 5월에 출시될 것으로 예상되는 추론 능력 향상 모델인 DeepSeek-R2의 기반이 될 것이라는 추측도 나오고 있습니다.
2. DeepSeek V3-0324 특징 및 주요 기능
DeepSeek V3-0324는 DeepSeek에서 개발한 대규모 언어 모델(LLM)의 특정 체크포인트입니다. 체크포인트는 모델 학습 과정의 특정 시점에서 모델의 가중치와 상태를 저장한 파일입니다. DeepSeek-V3 모델은 6850억(685B) 개의 파라미터를 가진 Mixture-of-Experts (MoE) 모델로 알려져 있습니다. DeepSeek V3-0324 모델 파일의 총 크기는 641GB에 달합니다.
DeepSeek V3-0324는 이전 버전에 비해 특히 코딩 능력이 개선되었다는 초기 피드백이 있습니다. 한 사용자 리뷰에서는 복잡한 추론 과제(예: "회전하는 도형 안에서 튕기는 공")를 효과적으로 통과했다고 언급하기도 했습니다.
주요 특징 및 기능:
- MIT 라이선스: 상업적 이용이 자유롭습니다.
- 오픈 소스: Hugging Face를 통해 모델 가중치를 무료로 다운로드하여 사용할 수 있으며, 연구 및 개발 커뮤니티에 기여할 수 있습니다.
- 무료 API 제공: OpenRouter를 통해 DeepSeek V3-0324를 무료로 사용할 수 있는 API 키를 얻을 수 있습니다. OpenRouter는 사용자의 프롬프트 크기와 파라미터를 처리할 수 있는 최적의 제공업체로 요청을 라우팅하며, 가용성을 최대화하기 위한 폴백(fallback) 기능을 제공합니다.
- 컨텍스트 길이: OpenRouter를 통해 사용할 경우 131,072 토큰의 컨텍스트 길이를 지원합니다.
- 톤 및 성격 변화: 이전 DeepSeek V3 모델에 비해 "더 로봇 같은" 또는 "너무 지적인" 톤으로 느껴진다는 일부 사용자들의 의견이 있습니다. 즉, 이전 모델의 더 인간적이고 대화적인 어투와 비교했을 때 차이가 있을 수 있습니다.
3. DeepSeek V3-0324 벤치마크 결과
현재까지 DeepSeek V3-0324에 대한 공식적인 벤치마크 결과는 발표되지 않았습니다. 하지만 사용자들의 테스트 및 후기들이 온라인을 통해 공유되고 있으며, 향후 다양한 벤치마크 결과가 나올 것으로 예상됩니다. X에 게시된 Xeophon 사용자의 벤치마크 테스트 결과에서 DeepSeek V3-0324는 Sonnet 3.5를 능가하는 최고의 비추론 모델로 언급되고 있습니다.
(업데이트) DeepSeek API Docs에 따르면 DeepSeek V3-0324는 추론 능력이 크게 향상되었으며, 다양한 벤치마크에서 다음과 같은 성능 개선을 보였습니다:
- MMLU-Pro: 75.9 → 81.2 (+5.3)
- GPQA: 59.1 → 68.4 (+9.3)
- AIME: 39.6 → 59.4 (+19.8)
- LiveCodeBench: 39.2 → 49.2 (+10.0)
4. DeepSeek V3-0324 사용방법
DeepSeek V3-0324는 현재 OpenRouter의 무료 API를 통해 접근할 수 있습니다.
base_url="https://openrouter.ai/api/v1"
model="deepseek/deepseek-chat-v3-0324:free"
from openai import OpenAI
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="<OPENROUTER_API_KEY>",
)
completion = client.chat.completions.create(
extra_headers={
"HTTP-Referer": "<YOUR_SITE_URL>", # Optional. Site URL for rankings on openrouter.ai.
"X-Title": "<YOUR_SITE_NAME>", # Optional. Site title for rankings on openrouter.ai.
},
extra_body={},
model="deepseek/deepseek-chat-v3-0324:free",
messages=[
{
"role": "user",
"content": "What is the meaning of life?"
}
]
)
print(completion.choices[0].message.content)
https://openrouter.ai/deepseek/deepseek-chat-v3-0324:free/api
DeepSeek V3 0324 (free) - API, Providers, Stats
DeepSeek V3, a 685B-parameter, mixture-of-experts model, is the latest iteration of the flagship chat model family from the DeepSeek team. It succeeds the [DeepSeek V3](/deepseek/deepseek-chat-v3) model and performs really well on a variety of tasks. Run D
openrouter.ai
VS Code의 확장 프로그램 Cline에서도 아래 화면과 같이 DeepSeek V3-0324를 코딩 보조로 사용하실 수 있습니다.
5. DeepSeek V3-0324 성능 테스트
다음은 DeepSeek V3-0324의 성능을 테스트해 보겠습니다.
- 구면 내에서 튀는 100개의 노란색 공 생성 스크립트: 천천히 회전하는 구 내에서 노란색 공이 머무르면서 충돌 감지를 처리하는 스크립트를 p5.js로 구현하기
write a script for 100 bouncing yellow balls within a sphere, make sure to handle collision detection properly. make the sphere slowly rotate. make sure balls stays within the sphere. implement it in p5.js
구면 내에서 100개의 튀는 노란색 공에 대한 스크립트를 작성해줘, 충돌 감지를 제대로 처리해야 해. 구가 천천히 회전하도록 해줘. 공이 구 안에 머무르도록 해줘. p5.js로 구현해줘


- 지구-화성 탐사궤도 애니메이션 생성: 우주선이 지구에서 출발해서 화성까지 갔다가 돌아오는 애니메이션 구현
Generate code for an animated 3D plot of a launch from earth landing on mars and then back to earth at the next launch window
지구에서 화성에 착륙한 후 다음 발사 창에서 지구로 돌아오는 애니메이션 3D 플롯에 대한 코드를 생성해줘
Grok-3가 DeepSeek V3-0324의 코드를 평가한 결과는 아래와 같습니다.
종합 평가
이 코드는 교육적 목적이나 개념적 시각화를 위해 매우 훌륭합니다. 지구-화성 임무의 기본적인 궤적과 타이밍을 효과적으로 보여주며, Matplotlib의 3D 애니메이션 기능을 잘 활용했습니다. 그러나 실제 우주 항법 시뮬레이션을 목표로 한다면, 타원 궤적 계산, 중력 효과, 정확한 발사 창 계산 등을 추가해야 합니다.
다음은 DeepSeek V3-0324의 코딩, 수학, 추론 성능을 테스트해 보겠습니다. 코딩 성능은 코딩 교육 사이트 edabit.com의 Python, JavaScript, C++ 문제를 통해 테스트하고, 수학 문제는 기하학, 확률, 수열, 최적화, 복합 문제 등으로 구성된 6개의 문제를 사용했습니다. 모든 평가 항목은 재시도 없이 첫 번째 시도의 채점 결과를 그대로 반영하였습니다.
DeepSeek-V3-0324 | Medium | Hard | Very Hard | Expert |
Python | Pass | Pass | Pass | Pass |
JavaScript | Pass | Pass | Pass | Pass |
C++ | Pass | Pass | Pass | Pass |
코딩 테스트 결과, DeepSeek V3-0324는 Python, JavaScript, C++ 모든 난이도 문제를 성공하였습니다.
No. | 문제 구분 | 문제 | DeepSeek-V3-0324 |
1 | 기초 대수 문제 | 두 숫자 𝑥 x와 𝑦 y가 있습니다. 이들이 만족하는 식은 3 𝑥 + 4 𝑦 = 12 3x+4y=12이며, 𝑥 − 2 𝑦 = 1 x−2y=1입니다. 𝑥 x와 𝑦 y의 값을 구하세요 | Pass |
2 | 기하학 문제 | 반지름이 7cm인 원의 넓이를 구하세요. 𝜋 = 3.14159 π=3.14159로 계산하세요. | Pass |
3 | 확률 문제 | 주사위를 두 번 던졌을 때, 두 숫자의 합이 7이 될 확률을 구하세요. | Pass |
4 | 수열 문제 | 첫 번째 항이 3이고, 공차가 5인 등차수열의 10번째 항을 구하세요. | Pass |
5 | 최적화 문제 | 어떤 직사각형의 둘레가 36cm입니다. 이 직사각형의 넓이를 최대화하려면 가로와 세로의 길이는 각각 얼마여야 하나요? | Pass |
6 | 복합 문제 | 복소평면에서 다음 극한값을 구하시오. lim[n→∞] (1 + i/n)^(n^2) 여기서 i는 허수단위 (i^2 = -1)입니다. | Pass |
수학 테스트에서는 기초 대수, 기하학, 확률, 수열, 최적화, 복합문제 등 6문제를 모두 성공하였습니다.
No. | 문제 | DeepSeek-V3-0324 |
1 | 5학년과 6학년 학생 160명이 나무 심기에 참가하였습니다. 6학년 학생들이 각각 평균5그루,5학년 학생들이 각각 평균 3그루씩 심은 결과 모두 560그루를 심었습니다. 나무심기에 참가한 5,6학년 학생은 각각 몇명일까요? |
Pass |
2 | 베티는 새 지갑을 위해 돈을 모으고 있습니다. 새 지갑의 가격은 $100입니다. 베티는 필요한 돈의 절반만 가지고 있습니다. 그녀의 부모는 그 목적을 위해 $15를 주기로 결정했고, 할아버지와 할머니는 그녀의 부모들의 두 배를 줍니다. 베티가 지갑을 사기 위해 더 얼마나 많은 돈이 필요한가요? | Pass |
3 | 전국 초등학생 수학경시대회가 열렸는데 영희,철수,진호 세사람이 참가했습니다. 그들은 서울,부산,인천에서 온 학생이고 각각 1등,2등,3등 상을 받았습니다. 다음과 같은 사항을 알고 있을때 진호는 어디에서 온 학생이고 몇등을 했습니까? 1) 영희는 서울의 선수가 아닙니다. 2) 철수는 부산의 선수가 아닙니다. 3)서울의 선수는 1등이 아닙니다. 4) 부산의 선수는 2등을 했습니다. 5)철수는 3등이 아닙니다. | Pass |
4 | 방 안에는 살인자가 세 명 있습니다. 어떤 사람이 방에 들어와 그중 한 명을 죽입니다. 아무도 방을 나가지 않습니다. 방에 남아 있는 살인자는 몇 명입니까? 단계별로 추론 과정을 설명하세요. | Pass |
5 | A marble is put in a glass. The glass is then turned upside down and put on a table. Then the glass is picked up and put in a microwave. Where's the marble? Explain your reasoning step by step. | Pass |
6 | 도로에 5대의 큰 버스가 차례로 세워져 있는데 각 차의 뒤에 모두 차의 목적지가 적혀져 있습니다. 기사들은 이 5대 차 중 2대는 A시로 가고, 나머지 3대는 B시로 간다는 사실을 알고 있지만 앞의 차의 목적지만 볼 수 있습니다. 안내원은 이 몇 분의 기사들이 모두 총명할 것으로 생각하고 그들의 차가 어느 도시로 가야 하는지 목적지를 알려 주지 않고 그들에게 맞혀 보라고 하였습니다. 먼저 세번째 기사에게 자신의 목적지를 맞혀 보라고 하였더니 그는 앞의 두 차에 붙여 놓은 표시를 보고 말하기를 "모르겠습니다." 라고 말하였습니다. 이것을 들은 두번째 기사도 곰곰히 생각해 보더니 "모르겠습니다." 라고 말하였습니다. 두명의 기사의 이야기를 들은 첫번째 기사는 곰곰히 생각하더니 자신의 목적지를 정확하게 말하였습니다. 첫번째 기사가 말한 목적지는 어디입니까? | Pass |
DeepSeek V3-0324는 추론 성능 테스트도 모두 성공하였습니다.
"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
5. 맺음말
DeepSeek V3-0324는 MIT 라이선스를 채택한 강력한 오픈 소스 대규모 언어 모델로서, 특히 향상된 코딩 능력을 바탕으로 다양한 분야에서 활용될 잠재력을 보여주고 있습니다. 아직 공식적인 벤치마크 결과는 발표되지 않았지만, 초기 사용자들은 긍정적인 피드백을 보이고 있습니다.
무료 API를 통해 쉽게 접근하여 사용할 수 있다는 점 또한 DeepSeek V3-0324의 큰 장점이며, 향후 DeepSeek-R2의 기반 모델이 될 가능성까지 시사하며 앞으로의 발전이 더욱 기대됩니다. 여러분도 OpenRouter에 가셔서 무료 API를 이용해서 최신 DeepSeek 모델을 경험해 보시면 좋을 것 같습니다. 저는 그럼 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다.
2025.01.23 - [AI 언어 모델] - 🐋DeepSeek-R1: OpenAI-o1 뛰어넘은 오픈소스 추론 모델이 무료!
🐋DeepSeek-R1: OpenAI-o1 뛰어넘은 오픈소스 추론 모델이 무료!
안녕하세요! 오늘은 DeepSeek AI에서 개발한 최신 추론 모델 DeepSeek-R1에 대해 알아보겠습니다. DeepSeek-R1은 순수 강화 학습(Pure Reinforcement Learning)을 통해 언어 모델의 추론 능력을 혁신적으로 향상시
fornewchallenge.tistory.com
'AI 언어 모델' 카테고리의 다른 글
👀👂🗣️✍️Qwen2.5-Omni: 보고, 듣고, 말하고, 쓰는 차세대 멀티모달 모델! (1) | 2025.03.30 |
---|---|
🔥♊Gemini 2.5 Pro-Exp: LMArena 1위! 구글의 최신 플래그십 AI 모델 (12) | 2025.03.29 |
🏯🧠Hunyuan-T1: GPT 4.5 뛰어넘은 세계 최초 Hybrid-Transformer-Mamba MoE 모델 (8) | 2025.03.23 |
🤖🔍📊EXAONE Deep: LG AI의 오픈소스 추론 능력 강화 모델 (8) | 2025.03.22 |
🤖✨ Gemma 3 모델 심층 분석: 구글의 차세대 개방형 멀티모달 AI (2) | 2025.03.15 |