본문 바로가기
728x90

AI 언어 모델131

🤖🔍QVQ-Max: 생각하고 이해하는 알리바바의 최첨단 시각적 추론 AI 안녕하세요! 오늘은 알리바바 클라우드의 Qwen 팀에서 개발한 최첨단 시각적 추론 AI 모델인 QVQ-Max에 대해 자세히 알아보겠습니다. 2025년 3월 28일 공개된 이 모델은 무려 720억 개의 파라미터를 자랑하며, 단순 이미지와 비디오 분석을 넘어 심층적인 추론과 문제 해결 능력을 갖춘 혁신적인 시각적 추론 AI로 주목받고 있습니다. QVQ-Max는 복잡한 차트, 다이어그램, 일상 사진 등 다양한 시각적 입력을 세밀하게 분석하고, 이를 바탕으로 배경 지식과 통합하여 심층적인 이해와 추론을 수행할 수 있는 모델입니다. 이번 블로그에서는 QVQ-Max의 핵심 특징, 사용 방법 및 성능 테스트 결과를 상세히 살펴보겠습니다.     1. QVQ-Max 개요알리바바의 Qwen 팀에서 개발한 QVQ-Max는.. 2025. 3. 31.
👀👂🗣️✍️Qwen2.5-Omni: 보고, 듣고, 말하고, 쓰는 차세대 멀티모달 모델! 안녕하세요! 오늘은 중국의 알리바바 클라우드에서 만든 Qwen2.5-Omni에 대해서 알아보겠습니다. 2025년 3월 27일, 공개된 이 모델은 텍스트, 이미지, 오디오, 비디오 등 다양한 모달리티를 이해하고 동시에 텍스트와 자연스러운 음성 응답을 스트리밍 방식으로 생성할 수 있는 멀티모달 모델로서, 혁신적인 아키텍처와 새로운 위치 임베딩 알고리즘을 통해 OmniBench에서 최첨단 성능을 달성했습니다. 이 블로그에서는 Qwen2.5-Omni의 주요 특징, 벤치마크 결과, 이용 방법 및 성능 테스트를 자세히 살펴보겠습니다.1. Qwen2.5-Omni 개요Qwen2.5-Omni는 다양한 모달리티를 통합적으로 처리하고 텍스트와 자연스러운 음성 응답을 실시간 스트리밍 방식으로 생성하는 단일 모델입니다. 기존의.. 2025. 3. 30.
🔥♊Gemini 2.5 Pro-Exp: LMArena 1위! 구글의 최신 플래그십 AI 모델 안녕하세요! 오늘은 Google의 최신 플래그십 모델, Gemini 2.5 Pro-Exp에 대해 알아보겠습니다. Gemini 2.5 Pro-Exp는 기존 Gemini 1.5 Pro 모델 대비 언어 이해, 멀티모달 처리, 코드 작성, 추론 능력에서 더욱 향상된 성능으로 LMArena 리더보드 1위를 차지하였으며, 특히 긴 컨텍스트 처리와 복잡한 문제 해결 능력이 강화된 점이 주목받고 있습니다. 이번 블로그에서는 Gemini 2.5 Pro의 주요 특징, 성능 벤치마크, 사용방법, 그리고 실제 테스트 결과를 살펴보고, 이 모델이 어떤 차별점을 가지고 있는지 분석해 보겠습니다.1. Gemini 2.5 Pro Exp 개요이번에 공개된 Gemini 2.5 Pro Exp는 사고 능력이 내장된 Gemini 2.5 제품.. 2025. 3. 29.
🐳 DeepSeek V3-0324 공개! 오픈소스 LLM의 새로운 강자 등장 안녕하세요! 오늘은 중국의 AI 연구소 DeepSeek에서 발표한 최신 대규모 언어 모델, DeepSeek V3-0324에 대해 살펴보겠습니다. DeepSeek V3-0324는 2024년 3월 24일에 공개된 새로운 체크포인트 모델로, 이전 DeepSeek V3 모델을 업데이트한 버전입니다. 특히, MIT 라이선스로 배포되어 상업적 활용이 가능하다는 점에서 큰 주목을 받고 있습니다.이번 블로그에서는 DeepSeek V3-0324의 개요, 특징 및 주요 기능, 벤치마크 결과를 살펴보고, 실제로 코딩, 수학, 추론 성능을 테스트해 보겠습니다. 언어 모델의 한 획을 그은 DeepSeek의 성능이 얼마나 개선되었는지 확인하러 가보실까요?"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 .. 2025. 3. 25.
🏯🧠Hunyuan-T1: GPT 4.5 뛰어넘은 세계 최초 Hybrid-Transformer-Mamba MoE 모델 안녕하세요! 오늘은 중국의 IT기업 텐센트가 새롭게 발표한 최신 인공지능 모델, Hunyuan-T1(혼원-T1)에 대해 살펴보겠습니다.  Hunyuan-T1은 세계 최초의 Mamba 아키텍처 기반 초대형 모델로, 트랜스포머 아키텍처와 Mamba 아키텍처를 결합한 하이브리드 구조를 채택하여, 긴 시퀀스 처리 능력을 획기적으로 향상시켰습니다. 특히, TurboS라는 고속 사고 기반 모델을 기반으로 대규모 사후 학습을 통해 추론 능력을 크게 확장하였으며, 인간 선호도에 더욱 부합하도록 설계되었습니다. 오늘 블로그에서는 Hunyuan-T1의 개요, 특징 및 주요 기능, 벤치마크 결과에 대해 알아보고 코딩, 수학, 추론성능을 직접 테스트해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정.. 2025. 3. 23.
🤖🔍📊EXAONE Deep: LG AI의 오픈소스 추론 능력 강화 모델 안녕하세요! 오늘은 LG AI 연구원에서 공개한 최신 오픈소스 추론 모델, EXAONE-DEEP에 대해 알아보겠습니다. 이번에 공개된 EXAONE Deep 모델은 2.4B, 7.8B, 32B 모델이며, 이 모델들은 EXAONE 3.5를 기반으로 추론 능력에 특화하여 미세 조정(fine-tuning)된 버전입니다. 이 모델들을 최신 학습 기법을 활용하여 학습되었으며, LG AI 연구원이 공개한 평가 결과에서 주요 공개 모델들과 경쟁적인 성능을 보입니다. 이 블로그에서는 EXAONE-DEEP 모델의 특징, 벤치마크 결과와 사용방법에 대해 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."1. EXAONE Deep 개요 EXAONE Deep은 LG AI .. 2025. 3. 22.
728x90