본문 바로가기
반응형

AI 언어 모델71

[Ollama 활용] 허깅페이스 Solar를 나만의 커스텀 언어 모델로 바꾸기 안녕하세요! 오늘은 대형 언어 모델 도구 Ollama를 이용해서 커스텀 언어 모델을 만들어 보겠습니다. 커스텀 언어 모델은 시스템 프롬프트 등을 변경하여 사용자가 원하는 방식으로 동작하도록 조정한 언어 모델을 말합니다. 이 블로그에서는 허깅페이스 대형 언어 모델을 OpenAI 호환기능, Langchain, 파이썬, 자바스크립트 등의 활용이 가능한 Ollama 로컬 모델로 변환하고, 시스템 프롬프트를 변경해서 커스텀 언어 모델을 만드는 방법에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 허깅페이스 모델 가져오기 먼저 커스텀 언어 모델을 만들기 위해 기본이 되는 모델을 허깅페이스에서 가져오겠습니다. 제가 선택한 모델은 국내기업 업스테이지의 .. 2024. 3. 5.
Sora: 현실 세계를 시뮬레이션하는 OpenAI 비디오 생성 모델 안녕하세요! 오늘은 OpenAI에서 어제 공개한 새로운 생성형 AI 모델 Sora에 대해서 알아보겠습니다. Sora는 다양한 길이, 종횡비 및 해상도를 가진 비디오 및 이미지를 생성할 수 있는 시각 데이터 모델로서, 최대 1분까지의 고화질 비디오를 생성할 수 있으며, 뛰어난 사실감으로 현실 세계를 시뮬레이션할 수 있는 가능성을 보여줍니다. 이 블로그에서는 Sora의 비디오 생성 원리, 주요 특징과 기능 등에 대해서 살펴보겠습니다. 블로그 내용의 출처는 아래 링크와 같습니다. https://openai.com/research/video-generation-models-as-world-simulators "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Sora 개요.. 2024. 2. 17.
벡터 데이터베이스와 Llama2를 활용한 arXiv 논문 자동검색 및 분석 안녕하세요! 오늘은 벡터 데이터베이스와 대규모 언어 모델을 활용해서 자동으로 arXiv 논문을 검색하고 분석하는 방법에 대해 알아보겠습니다. 벡터 데이터베이스는 많은 숫자의 순서쌍으로 변환된 데이터를 효율적으로 저장하고 검색할 수 있는 데이터 저장소이며, 잘 알려진 솔루션으로는 Qdrant, ChromaDB, Milvus 등이 있습니다. 이 블로그에서는 벡터 데이터베이스의 개념과 구조, 원리 등에 대해서 알아보고, 활용예제 코드를 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 벡터 데이터베이스 개요 벡터 데이터베이스는 딥 러닝 아키텍처와 같은 기계 학습 모델을 위한 추상적인 데이터 표현과 상호 작용하는 방법입니다. 벡터 데이터는 여러 개의 숫자.. 2024. 2. 16.
구글 제미나이 울트라 1.0, 과연 진정한 AI 혁신인가? 솔직 후기 공개! 안녕하세요! 오늘은 구글의 인공지능 제미나이의 최상위 버전인 울트라의 사용후기를 작성해 보겠습니다. 제미나이 울트라는 구글 AI에서 개발한 최첨단 대화형 인공지능(AI) 모델이며, 1,560조 개의 방대한 파라미터로 학습되어 인간과 유사한 수준의 대화가 가능하고 텍스트 생성, 번역, 코딩, 요약, 스토리텔링 등 다양한 작업을 수행할 수 있다고 합니다. 이 블로그에서는 제미나이 울트라의 이미지 생성 및 인식, 이야기 생성, 언어와 코딩 기능, 환각현상 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 제미나이 울트라 접속방법 그동안 서비스가 제공되던 구글의 바드는 이제 제미나이로 통합되었으며, 현재 제미나이 울트라는 아직 공식 한국사이트.. 2024. 2. 12.
LLaVA NeXT: 제미나이 프로를 뛰어넘는 오픈소스 멀티모달 AI! 안녕하세요! 오늘은 멀티모달 대규모 언어 모델 LLaVA의 업데이트 소식에 대해 알아보겠습니다. LLaVA (Language-Image Visual Assistant, 언어-이미지 시각 어시스턴트)는 시각적 지시 조정기술(Visual Instruction Tuning, VIT)을 기반으로 개발된 언어와 이미지 간의 복합적인 상호 작용에 중점을 둔 멀티모달 모델입니다. 이번에 발표된 LLaVA NeXT는 여러 벤치마크에서 구글의 제미나이 프로를 능가하며, 이전 버전인 LLaVA 1.5에 비해 입력 이미지 해상도, OCR기능등이 개선되었다고 합니다. 이 블로그에서는 LLaVA NeXT의 특징, 개선 사항, 벤치마크 결과, 로컬 실행 방법 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으.. 2024. 2. 8.
메타의 새로운 코딩용 대규모 언어 모델 : Code Llama 70B 안녕하세요! 오늘은 메타에서 최근 공개한 Code Llama 70B에 대해서 알아보겠습니다. Code Llama 70B는 Code Llama 패밀리에서 가장 크고 성능이 우수한 모델로써, 이전에 공개된 Code Llama 모델과 동일한 세 가지 버전으로 제공되며, 모두 연구 및 상업적 사용을 위해 무료로 사용 가능합니다. 이 블로그에서는 Code Llama 70B의 개요, 특징, 성능평가, DEMO 코드 실행결과 등에 대해서 확인하실 수 있습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Code Llama 70B 개요 Code Llama는 코드 및 자연어 프롬프트에서 코드를 생성할 수 있는 최신 기술의 대형 언어 모델(Large Language Mode.. 2024. 1. 31.
반응형