728x90 AI 언어 모델115 LLaVA NeXT: 제미나이 프로를 뛰어넘는 오픈소스 멀티모달 AI! 안녕하세요! 오늘은 멀티모달 대규모 언어 모델 LLaVA의 업데이트 소식에 대해 알아보겠습니다. LLaVA (Language-Image Visual Assistant, 언어-이미지 시각 어시스턴트)는 시각적 지시 조정기술(Visual Instruction Tuning, VIT)을 기반으로 개발된 언어와 이미지 간의 복합적인 상호 작용에 중점을 둔 멀티모달 모델입니다. 이번에 발표된 LLaVA NeXT는 여러 벤치마크에서 구글의 제미나이 프로를 능가하며, 이전 버전인 LLaVA 1.5에 비해 입력 이미지 해상도, OCR기능등이 개선되었다고 합니다. 이 블로그에서는 LLaVA NeXT의 특징, 개선 사항, 벤치마크 결과, 로컬 실행 방법 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으.. 2024. 2. 8. 메타의 새로운 코딩용 대규모 언어 모델 : Code Llama 70B 안녕하세요! 오늘은 메타에서 최근 공개한 Code Llama 70B에 대해서 알아보겠습니다. Code Llama 70B는 Code Llama 패밀리에서 가장 크고 성능이 우수한 모델로써, 이전에 공개된 Code Llama 모델과 동일한 세 가지 버전으로 제공되며, 모두 연구 및 상업적 사용을 위해 무료로 사용 가능합니다. 이 블로그에서는 Code Llama 70B의 개요, 특징, 성능평가, DEMO 코드 실행결과 등에 대해서 확인하실 수 있습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Code Llama 70B 개요 Code Llama는 코드 및 자연어 프롬프트에서 코드를 생성할 수 있는 최신 기술의 대형 언어 모델(Large Language Mode.. 2024. 1. 31. Ollama와 대규모 언어 모델 Llama2-uncensored를 활용한 PDF 요약과 음성변환 안녕하세요! 오늘은 대규모 언어 모델 활용도구인 Ollama를 활용해서 PDF의 내용을 요약하고 읽어주는 Llama2-unsensored(무검열) 모델을 만나보겠습니다. unsensored는 부적절한 내용이나 표현의 제한이 없는 모델을 가리킵니다. 예를 들면, "차를 어떻게 훔칠 수 있어?"라는 질문에 일반적인 언어 모델은 불법적이고 비윤리적인 정보를 제공할 수 없다고 응답하지만, 무검열 모델은 이러한 질문에도 제한 없이 답변할 수 있습니다. 이 블로그에서는 무검열 언어 모델을 이용한 텍스트 요약, PDF 파일처리 및 동적 페이지 범위설정, Text to Speech 라이브러리, gradio 웹 인터페이스 구축 등에 대해 알아보실 수 있습니다. 자, 같이 시작하실까요? "이 포스팅은 쿠팡 파트너스 활동의.. 2024. 1. 13. Mixtral 대규모 언어 모델과 RAG을 활용한 위키피디아 검색 자동화 안녕하세요! 오늘은 대규모 언어 모델 Mixtral과 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 기술을 활용해서 위키피디아 검색을 자동화하는 프로젝트에 도전해 보겠습니다. 검색 자동화는 직접 사이트에서 검색하는 방식에 비해 검색 시간을 단축하고 효율을 향상시키며, 사용자 정의 가능성과 시스템 통합의 용이성 등 여러 가지 장점을 제공합니다. 이 블로그에서는 이전에 다룬 Haystack-AI를 활용한 위키피디아 데이터 수집, 인덱싱, 파이프라인 구성, 그리고 자연어 처리 기반 RAG 구축 방법 등에 대해 자세히 살펴보겠습니다. 이 프로젝트의 출처는 유튜브 "Zephyr Wikipeda Chatbot Brings Knowledge to Life" 이며, HuggingFa.. 2024. 1. 11. Mixtral 8x7B 대규모 언어 모델로 온라인 의학 정보를 쉽게 확인해보세요. 안녕하세요! 오늘은 사용자의 요청이나 질문에서 키워드를 자동으로 추출해서 PubMed 의학정보 데이터베이스를 검색하고, 대규모 언어모델을 통해 응답하는 시스템을 만들어 보겠습니다. PubMed은 의학 및 생명과학 분야의 학술적 논문과 연구 결과를 수록한 미국 국립 의학 도서관(National Library of Medicine)에서 운영하는 무료 온라인 데이터베이스입니다. 이 블로그에서는 허깅페이스를 통한 대규모 언어 모델 활용방법과, Haystack-AI, pymed, PubMed 검색방법 등에 대해서 확인하실 수 있습니다. 그럼, 출발하실까요? 이 프로젝트의 출처는 유튜브 "Transform Healthcare with Mixtral: Create Your Own Chatbot Now" 입니다. "이.. 2024. 1. 10. CrewAI를 이용한 대규모 언어 모델 Solar와 Hermes의 협업 프로젝트 안녕하세요! 오늘은 CrewAI라는 도구를 이용해서 국산 대규모 언어 모델 Solar와 Mistral 7B의 미세조정 모델인 Hermes의 협업 프로젝트를 만들어 보겠습니다. CrewAI는 인공 지능(AI) 에이전트에게 역할을 할당하고 목표를 공유하며 상호 작용하도록 조직화하는 데 사용되는 프레임워크입니다. 이 블로그에서는 Langchain과 Ollama를 통한 오픈소스 LLM 활용법과 CrewAI를 이용한 두 언어 모델의 협업 프로젝트에 대해 확인하실 수 있습니다. 자, 그럼 출발하실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." CrewAI? CrewAI는 깃허브에 공개되어 있는 프레임워크로, 공동의 목표를 위해 상호 작용하는 인공 지능(AI) 에이전.. 2024. 1. 7. 이전 1 ··· 10 11 12 13 14 15 16 ··· 20 다음 728x90