🌟Aria: 최신 오픈소스 멀티모달 네이티브 MoE 모델
안녕하세요! 오늘은 Aria라는 오픈소스 멀티모달 네이티브 Mixture-of-Experts (MoE) 모델에 대해서 알아보겠습니다. Aria는 Rhymes AI가 개발한 모델로 텍스트, 이미지, 비디오, 코드를 포함한 다양한 형태의 데이터를 단일 모델로 처리하고 이해할 수 있습니다. Aria는 멀티모달 네이티브 이해, 긴 컨텍스트 윈도우, 빠른 처리 속도와 뛰어난 명령어 따르기 능력, 오픈소스 및 개발자 친화적인 환경을 통해 다양한 멀티모달 작업에서 잠재력을 가진 강력한 AI 모델입니다. 이 블로그에서는 Aria의 개요, 특징, 주요기능, 벤치마크 결과에 대해 알아보고, 실제성능을 테스트해 보겠습니다. https://rhymes.ai/ https://rhymes.ai/We're building the ..
2024. 10. 14.
🤖마이크로소프트 Phi-3.5 시리즈: 소형 MoE 모델의 혁신
안녕하세요! 오늘은 마이크로소프트의 최신 모델 Phi-3.5 시리즈에 대해 알아보겠습니다. Phi-3.5는 세 가지 다른 버전(MoE-instruct, Mini-instruct, Vision-instruct)으로 출시되었으며, 이전 버전인 Phi-3 모델과 비교해서 MoE(Mixture of Experts) 아키텍처 도입, 다국어 능력 향상, 멀티모달 능력 추가 등을 통해 더 적은 자원을 사용하면서도 높은 성능을 유지하고, 다양한 작업에서 더 높은 효율성을 발휘합니다. 이 블로그에서는 Phi-3.5 개요, 특징 및 주요 기능, 성능평가 결과에 대해 알아보고, Phi-3.5- MoE-instruct의 코딩 및 추론성능을 실제로 테스트해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른..
2024. 8. 24.
⚡Hermes 3: Llama 3.1을 넘어선 최첨단 오픈 소스 언어 모델의 등장
안녕하세요! 오늘은 Nous Research에서 개발한 최신 오픈 소스 대규모 언어 모델 Hermes 3에 대해 알아보겠습니다. Hermes 3는 AGIEval(일반 인공지능 평가 능력), ARC-C(상식적 추론 능력), ARC-E(과학적 추론 능력), Hellaswag(상황 예측 능력), TruthfulQA(사실 기반 응답 능력) 등의 평가지표에서 메타의 Llama 3.1 모델보다 우수한 성능을 보이며, 유연한 페르소나 적용, 구조화된 출력, 단계별 추론 및 계획, Mermaid 다이어그램 표현 등 다양한 고급기능을 갖추고 있습니다. 이 블로그에서는 Hermes 3의 특징 및 주요 기능, 성능평가 결과를 살펴보고, 코딩 및 추론성능 테스트와 비주얼 스튜디오 코드 Co-pilot 설정방법에 대해 알아보겠..
2024. 8. 21.