본문 바로가기

AI 언어 모델115

[AI 논문] 올해의 한국어 LLM에 선정된 야놀자 언어 모델, EEVE 안녕하세요! 오늘은 최근 "올해의 한국어 LLM"으로 선정된 야놀자의 대형 언어 모델, EEVE에 대해 살펴보겠습니다. EEVE모델은 Efficient and Effective Vocabulary Expansion의 약자로, 효율적이고 효과적인 어휘 확장을 위한 파라미터 동결, 서브워드 기반 임베딩 초기화, 다단계 학습과 같은 접근방법을 통해 기존의 영어 언어 모델을 한국어 모델로 확장하고 새로운 언어 토큰을 통합한 모델입니다. 야놀자는 EEVE 언어 모델을 통해 사용자의 후기를 요약하고 인사이트를 얻기 위해 도입하였다고 하는데요, 이 블로그에서는 논문을 통해 EEVE 모델의 개요, 어휘 확장 방법, 학습과정, 성능평가 결과에 대해 알아보고, Ollama UI, LM Studio를 활용해서 EEVE 모델.. 2024. 4. 13.

Dolphin 2.8: 무엇이든 대답하는 무검열 Mistral 최신 모델과 오프라인 대화(크롬 브라우저 Ollama UI) 안녕하세요! 오늘은 Mistral AI의 최신 대규모 언어 모델 Mistral 7B v0.2를 기반으로 미세조정하여 만들어진 Dolphin 2.8 모델을 크롬 브라우저에서 만나보겠습니다. Dolphin 2.8은 2024년 3월 23일에 MistralAI가 발표한 Mistral 7B v0.2를 기반으로 하여 개발되었으며, 텍스트를 처리할 때 고려하는 문맥의 크기는 32k 컨텍스트로서 다양한 명령, 대화 및 코딩 기능을 제공합니다. 이 모델은 검열되지 않았으며, 정렬 및 편견을 제거하기 위해 학습 데이터셋을 필터링하여, 보다 중립적이고 공정한 방식으로 조정했다고 합니다. 이 블로그에서는 크롬 브라우저의 Ollama UI 확장기능을 통해 Dolphin 2.8 언어모델과 오프라인으로 대화해 보겠습니다. http.. 2024. 4. 10.

클로드(Claude) 3 Opus로 arxiv 논문을 초등학생 수준으로 요약하기 안녕하세요! 오늘은 가장 발전된 대규모 언어 모델 클로드(Claude) 3 Opus를 활용해서 arxiv 논문을 이해하기 쉽게 요약해 보겠습니다. Opus 모델은 클로드 3 모델 패밀리 Haiku, Sonnet 및 Opus 중 가장 지능적인 모델로, 대학 수준 전문 지식(MMLU), 대학원 수준 전문 추론(GPQA), 기본 수학(GSM8K) 등 인공지능 시스템의 일반적인 평가 기준에서 GPT4나 제미나이 등 다른 모델들을 능가하는 성능을 보여줍니다. 이 블로그에서는 WSL 환경에서 앤트로픽 API와 클로드 3 Opus 모델을 활용해서 arxiv 논문을 요약하는 기능을 구현해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 다운로드하기 먼저, 내.. 2024. 4. 8.

🎨클로드(Claude) 3 Opus로 만드는 놀라운 일러스트! 안녕하세요! 오늘은 요즘 챗GPT보다 핫한 언어 모델 클로드 3을 이용해서 일러스트를 그려보겠습니다. 앤트로픽의 최신 대형 언어 모델인 클로드 3 모델은 성능과 속도를 고려하여 Haiku, Sonnet 및 Opus라는 세 가지 모델로 구성되어 있으며, 이 중 Opus 모델은 특히 GPT-4나 Gemini와 같은 기존 모델들을 능가하는 성능을 보여줍니다. 이 블로그에서는 Opus 모델과 Stable Diffusion을 활용해서 사용자의 질문에 대한 설명과 일러스트를 그리는 기능을 구현해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 프로그램 개요 이 블로그에서는 사용자가 질문을 입력하면, 해당 질문에 기반하여 텍스트 응답과 함께 이미지를 생성하여 제.. 2024. 4. 7.

🚀 ReALM, 화면 속 정보를 이해하는 애플의 새로운 AI 기술! 안녕하세요! 오늘은 최근 애플에서 공개한 최신 언어모델링 기술인 ReALM에 대해서 알아보겠습니다. ReALM은 "Reference Resolution As Language Modeling, 언어모델링을 통한 참조 해결"의 약자로, 대화 시스템이 사용자의 요청과 버튼, 텍스트, 이미지 등 화면에 표시된 객체나 정보를 식별하고 그 사이의 관계를 연결하여 사용자의 요청을 처리할 수 있도록 하는 기술인데요. ReALM은 화면의 객체를 텍스트로 인코딩하고 대화 시스템이 이를 이해해서 처리할 수 있도록 합니다. 이 블로그에서는 ReALM의 개요, 동작원리, 성능평가 결과 등에 대해서 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 이 논문의 목.. 2024. 4. 5.

5줄 파이썬 코드로 AI 주식 분석 완료! Hermes 2 Pro의 놀라운 함수 호출 기능 안녕하세요! 오늘은 최신 대규모 언어 모델 Hermes-2-Pro-Mistral-7B에 대해서 알아보겠습니다. Hermes-2-Pro-Mistral-7B는 NousResearch가 개발한 미스트랄(Mistral) 아키텍처 기반 대규모 언어 모델로, 함수호출과 JSON 출력에서 높은 성능과 다양한 자연어 이해 기능을 제공합니다. 이 블로그에서는 Hermes 2 Pro 개요와 특징, 파이썬 코드 5줄로 완성하는 주식분석 예제코드에 대해서 알아보겠습니다. https://huggingface.co/NousResearch/Hermes-2-Pro-Mistral-7B NousResearch/Hermes-2-Pro-3 Face Hermes 2 Pro - Mistral 7B Model Description Hermes .. 2024. 3. 19.

이전 1 ··· 8 9 10 11 12 13 14 ··· 20 다음

티스토리툴바