본문 바로가기
728x90

AI 언어 모델117

🚀 Llama 3.1: Meta의 최강 오픈소스 AI 모델 출시! 📈 안녕하세요! 오늘은 Meta에서 공개한 최신 언어모델 Llama 3.1에 대해서 알아보겠습니다. Llama 3.1은 8B, 70B, 405B 세 종류의 매개변수로 출시되었으며, 128K 문맥 길이와 8개 언어 지원을 특징으로 하는 오픈 소스 AI 모델로, 합성 데이터 생성, 모델 증류, 실시간 및 배치 추론,  호출, 지속적 사전 훈련 등을 지원하며, Llama Guard 3와 Prompt Guard를 포함한 안전 도구를 제공하고, Llama 스택 API를 통해 개발자들이 쉽게 활용할 수 있습니다. 이 블로그에서는 Llama 3.1의 개요, 주요 특징 및 아키텍처 등을 살펴보고, Llama 3.1 70B 모델의 코딩 및 추론성능을 테스트해 보겠습니다. https://ai.meta.com/blog/meta.. 2024. 7. 24.
Mistral NeMo: 🚀128k 긴 텍스트와 다국어 지원 미스트랄 최신 모델 안녕하세요! 오늘은 미스트랄이 Codestral Mamba에 이어 내놓은 또 하나의 AI 모델, Mistral NeMo에 대해 알아보겠습니다. Mistral NeMo는 최대 128k 토큰의 문맥 창을 제공하여 긴 텍스트도 처리할 수 있으며, 영어, 프랑스어, 한국어 등 다양한 언어를 지원합니다. 새로운 Tekken 토크나이저는 100개 이상의 언어에서 훈련되어 자연어 텍스트와 소스 코드를 효율적으로 압축하며, 한국어와 아랍어에서 특히 효율적입니다. 또한, 고도화된 지시 조정 기능을 통해 명령 수행, 논리적 추론, 다중 턴 대화 처리 및 코드 생성에 뛰어난 성능을 보입니다. 이 블로그에서는 Mistral NeMo의 개요, 특징 및 주요 기능에 대해 알아보고, 코딩 및 추론 테스트를 진행해 보겠습니다. "이.. 2024. 7. 20.
🚀 GPT-4o mini: OpenAI의 최첨단 고성능 저비용 AI 모델 안녕하세요! 오늘은 OpenAI의 가장 비용 효율적인 소형 모델, GPT-4o mini에 대해서 알아보겠습니다. GPT-4o mini는 입력 토큰 백만 개당 15센트, 출력 토큰 백만 개당 60센트로 가격이 책정되어 있으며, 이는 GPT-3.5 Turbo보다 60% 이상 저렴한 가격으로, 이전의 최첨단 모델 GPT-4o보다 훨씬 저렴하게 다양한 응용 프로그램을 구축할 수 있습니다. 이 블로그에서는 GPT-4o mini 개요, 특징 및 주요 기능에 대해 알아보고 코딩 및 추론 테스트를 해보겠습니다."이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."GPT-4o mini 개요 GPT-4o mini는 128K 토큰의 컨텍스트 윈도우와 최대 16K 출력 토큰을 지원하며, 저.. 2024. 7. 20.
미스트랄 Codestral Mamba:🐍Mamba 아키텍처로 무장한 코드 생성 AI 안녕하세요! 오늘은 미스트랄의 새로운 코드 생성 언어 모델, Codestral Mamba에 대해서 알아보겠습니다. Codestral Mamba는 프랑스의 Mistral AI 팀이 개발한 Mixtral 패밀리의 후속작으로, 특히 코드 생산성에 초점을 맞춘 모델입니다.  Transformer 모델과 달리 Mamba 모델은 선형 시간 추론을 통해 이론적으로 무한 길이의 시퀀스를 모델링함으로써, 입력 길이에 상관없이 빠른 응답을 보장합니다. 또한 Apache 2.0 라이선스를 통해 누구나 자유롭게 사용, 수정, 배포할 수 있습니다. 이 블로그에서는 Codestral Mamba의 개요와 Mamba 아키텍처에 대해 알아보고, 성능테스트 및 간단한 챗봇을 만들어 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으.. 2024. 7. 18.
✨구글 Gemma 2 분석: 최신 오픈소스 모델로 무료 챗봇 만들기 🤖🔓 안녕하세요! 오늘은 구글의 최신 언어 모델 Gemma 2에 대해서 알아보겠습니다. Gemma 2는 2B, 9B, 27B 매개변수 모델을 제공하며, 최신 기술인 로컬-글로벌 어텐션 교차와 그룹 쿼리 어텐션을 도입했습니다. 지식 증류 기법을 적용해 작은 모델의 성능을 높였고, 동급 모델들을 능가하는 성능을 보이며, 오픈 소스로 공개되어 누구나 사용하고 연구할 수 있어 AI 기술의 접근성을 향상시켰습니다. 이 블로그에서는 Gemma 2의 개요, 로컬-글로벌 어텐션 교차와 그룹 쿼리 어텐션, 지식 증류에 대해 알아보고, 추론/코딩성능 테스트 및 Ollama를 이용한 Gemma 2 챗봇을 만들어 보겠습니다. ✨구글 Gemma 2 분석: 최신 오픈소스 모델로 무료 챗봇 만들기 🤖🔓"이 포스팅은 쿠팡 파트너스 활.. 2024. 6. 29.
🖥️마이크로소프트 Florence-2 리뷰: 0.7B 비전 모델의 혁신🚀 안녕하세요! 오늘은 마이크로소프트의 최신 비전 모델 Florence-2에 대해서 알아보겠습니다. 이 모델은 복잡한 공간적 계층 구조와 의미론적 세분화를 다루는 능력을 통해 객체 감지, 이미지 캡션 생성은 물론, 각 픽셀을 객체 또는 장면 범주로 분류하는 시맨틱 분할, 특정 구문과 관련된 영역을 식별하는 구문 분할, 객체가 있을 가능성이 높은 이미지 영역을 제안하는 영역 제안과 같은 다양한 시각 작업을 수행할 수 있습니다. 이 블로그에서는 Florence-2 모델의 개요 및 주요 특징, 동작리에 대해 알아보고 주요 기능에 대한 DEMO 테스트를 진행해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Florence-2 개요 및 특징Florence-2의 .. 2024. 6. 28.
728x90