본문 바로가기

전체 글341

야놀자 한국어 언어 모델 EEVE와 Ollama로 구현하는 로컬 RAG 안녕하세요! 오늘은 한국어 언어 모델 EEVE를 활용해서 로컬 RAG을 구현해 보겠습니다. RAG(Retrieval-Augmented Generation, 검색 강화 생성)는 외부 지식소스 검색을 통해 정보를 얻고, 이를 바탕으로 답변을 생성함으로써, 언어모델이 환각현상이나 부정확한 답변을 하지 않도록 보장하는 기술인데요, 이 블로그에서는 우수한 성능으로 올해의 한국어 언어 모델에 선정된 야놀자의 EEVE와 LLM 관리도구인 Ollama를 이용해서 영어 문서와 한국어로 대화하는 로컬 RAG를 구현하는 예제를 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 프로그램 개요 오늘 알아볼 예제 코드는 대화상자를 통해 입력한 pdf 문서를 텍스트로 변환한.. 2024. 4. 17.

[초보 필수] 제미나이 1.5 프로 API 활용 가이드: 40분 오디오 분석 1분 완료! 안녕하세요! 오늘은 구글의 제미나이 1.5 프로 모델을 API를 이용해서 만나보겠습니다. 제미나이 1.5 프로는 최대 100만 토큰의 매우 긴 문맥을 이해하고 처리할 수 있으며, 텍스트, 코드, 이미지, 음성 및 영상 등 다양한 모달리티를 지원하는 모델로, 1시간 분량의 동영상과 11시간 분량의 음성 파일, 3만 줄 이상의 코드, 70만 단어 이상의 텍스트에 해당하는 방대한 정보를 한 번에 처리할 수 있는 성능을 갖추고 있습니다. 이 블로그에서는 제미나이 1.5 프로의 성능에 대해서 알아보고, API 예제를 통해 텍스트 생성과 이미지 설명, 40분 분량의 오디오 분석기능을 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Gemini 1.5 Pro.. 2024. 4. 16.

ComfyUI와 IP-Adapter plus를 활용한 오프라인 가상 피팅 가이드 안녕하세요! 오늘은 최근 공개된 ComfyUI의 IP-Adapter plus를 이용해서 오프라인 로컬 가상 피팅을 구현해 보겠습니다. 가상 피팅은 디지털 이미지나 가상의 모델을 사용하여 자신이 옷을 입은 모습을 시뮬레이션하여 미리 확인하는 것을 말하는데요, 온라인 쇼핑이나 의류 브랜드의 웹사이트에서 제공하고 있는 기능이지만 내 사진으로, 내가 원하는 포즈로, 내가 원하는 장소에서의 모습으로 자유롭게 미리 확인해 보는 것은 쉽지 않은데요. 이 블로그에서는 ComfyUI의 IPAdapter plus를 이용해서 내 컴퓨터에서 오프라인으로 가상 피팅을 체험해 보겠습니다. 아래 이미지들은 ComfyUI의 IPAdapter plus를 이용해서 생성한 가상 피팅 이미지들입니다. "이 포스팅은 쿠팡 파트너스 활동의 일.. 2024. 4. 14.

[AI 논문] 올해의 한국어 LLM에 선정된 야놀자 언어 모델, EEVE 안녕하세요! 오늘은 최근 "올해의 한국어 LLM"으로 선정된 야놀자의 대형 언어 모델, EEVE에 대해 살펴보겠습니다. EEVE모델은 Efficient and Effective Vocabulary Expansion의 약자로, 효율적이고 효과적인 어휘 확장을 위한 파라미터 동결, 서브워드 기반 임베딩 초기화, 다단계 학습과 같은 접근방법을 통해 기존의 영어 언어 모델을 한국어 모델로 확장하고 새로운 언어 토큰을 통합한 모델입니다. 야놀자는 EEVE 언어 모델을 통해 사용자의 후기를 요약하고 인사이트를 얻기 위해 도입하였다고 하는데요, 이 블로그에서는 논문을 통해 EEVE 모델의 개요, 어휘 확장 방법, 학습과정, 성능평가 결과에 대해 알아보고, Ollama UI, LM Studio를 활용해서 EEVE 모델.. 2024. 4. 13.

Dolphin 2.8: 무엇이든 대답하는 무검열 Mistral 최신 모델과 오프라인 대화(크롬 브라우저 Ollama UI) 안녕하세요! 오늘은 Mistral AI의 최신 대규모 언어 모델 Mistral 7B v0.2를 기반으로 미세조정하여 만들어진 Dolphin 2.8 모델을 크롬 브라우저에서 만나보겠습니다. Dolphin 2.8은 2024년 3월 23일에 MistralAI가 발표한 Mistral 7B v0.2를 기반으로 하여 개발되었으며, 텍스트를 처리할 때 고려하는 문맥의 크기는 32k 컨텍스트로서 다양한 명령, 대화 및 코딩 기능을 제공합니다. 이 모델은 검열되지 않았으며, 정렬 및 편견을 제거하기 위해 학습 데이터셋을 필터링하여, 보다 중립적이고 공정한 방식으로 조정했다고 합니다. 이 블로그에서는 크롬 브라우저의 Ollama UI 확장기능을 통해 Dolphin 2.8 언어모델과 오프라인으로 대화해 보겠습니다. http.. 2024. 4. 10.

[AI 논문] InstantStyle: 같은 스타일을 가진 새로운 이미지 만들기 안녕하세요! 오늘은 얼굴 사진 한 장으로 딥페이크를 생성하는 InstantID 기술을 공개했던 베이징의 스타트업 인스턴트 X에서 최근 공개한 InstantStyle이라는 기술에 대해서 알아보겠습니다. InstantStyle은 텍스트 기반 이미지 생성 시 컨텐츠와 스타일을 명확하게 구분하여 주어진 스타일을 유지하면서 새로운 이미지를 생성하는 기술입니다. 이 블로그에서는 InstantStyle의 개요, 구성요소, 동작원리에 대해 알아보고 DEMO 이미지를 생성해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 InstantStyle은 주어진 참조 이미지의 스타일을 보존하면서 텍스트 입력을 통해 새로운 이미지를 생성하는 것으로, 기존의 방법들은.. 2024. 4. 9.

클로드(Claude) 3 Opus로 arxiv 논문을 초등학생 수준으로 요약하기 안녕하세요! 오늘은 가장 발전된 대규모 언어 모델 클로드(Claude) 3 Opus를 활용해서 arxiv 논문을 이해하기 쉽게 요약해 보겠습니다. Opus 모델은 클로드 3 모델 패밀리 Haiku, Sonnet 및 Opus 중 가장 지능적인 모델로, 대학 수준 전문 지식(MMLU), 대학원 수준 전문 추론(GPQA), 기본 수학(GSM8K) 등 인공지능 시스템의 일반적인 평가 기준에서 GPT4나 제미나이 등 다른 모델들을 능가하는 성능을 보여줍니다. 이 블로그에서는 WSL 환경에서 앤트로픽 API와 클로드 3 Opus 모델을 활용해서 arxiv 논문을 요약하는 기능을 구현해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 다운로드하기 먼저, 내.. 2024. 4. 8.

🎨클로드(Claude) 3 Opus로 만드는 놀라운 일러스트! 안녕하세요! 오늘은 요즘 챗GPT보다 핫한 언어 모델 클로드 3을 이용해서 일러스트를 그려보겠습니다. 앤트로픽의 최신 대형 언어 모델인 클로드 3 모델은 성능과 속도를 고려하여 Haiku, Sonnet 및 Opus라는 세 가지 모델로 구성되어 있으며, 이 중 Opus 모델은 특히 GPT-4나 Gemini와 같은 기존 모델들을 능가하는 성능을 보여줍니다. 이 블로그에서는 Opus 모델과 Stable Diffusion을 활용해서 사용자의 질문에 대한 설명과 일러스트를 그리는 기능을 구현해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 프로그램 개요 이 블로그에서는 사용자가 질문을 입력하면, 해당 질문에 기반하여 텍스트 응답과 함께 이미지를 생성하여 제.. 2024. 4. 7.

🚀 ReALM, 화면 속 정보를 이해하는 애플의 새로운 AI 기술! 안녕하세요! 오늘은 최근 애플에서 공개한 최신 언어모델링 기술인 ReALM에 대해서 알아보겠습니다. ReALM은 "Reference Resolution As Language Modeling, 언어모델링을 통한 참조 해결"의 약자로, 대화 시스템이 사용자의 요청과 버튼, 텍스트, 이미지 등 화면에 표시된 객체나 정보를 식별하고 그 사이의 관계를 연결하여 사용자의 요청을 처리할 수 있도록 하는 기술인데요. ReALM은 화면의 객체를 텍스트로 인코딩하고 대화 시스템이 이를 이해해서 처리할 수 있도록 합니다. 이 블로그에서는 ReALM의 개요, 동작원리, 성능평가 결과 등에 대해서 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 이 논문의 목.. 2024. 4. 5.

🤯허깅챗 어시스턴트 영어 뉴스 번역 챗봇 만들기! URL만 입력하면 끝! 안녕하세요! 오늘은 자연어 처리 분야의 최첨단 언어 모델, 데이터셋, 코드를 무료로 제공하는 오픈 소스 커뮤니티인 허깅페이스의 허깅챗 어시스턴트 기능을 알아보겠습니다. 허깅챗 어시스턴트는 사용자가 선택한 모델을 기반으로 한 대화형 인공지능이며, 사용자와 대화하거나 특정 작업을 수행할 수 있는 채팅 인터페이스를 제공합니다. 사용자는 모델, 이름, 시스템 프롬프트를 선택하여 어시스턴트를 만들고, 이를 다른 사용자와 공유할 수 있습니다. 이 블로그에서는 허깅챗 어시스턴트를 활용해서 영문 뉴스 사이트의 URL만 입력하면 내용을 번역해서 요약해 주고, 뉴스 내용에 관한 질문에 응답하는 무료 챗봇을 만들어 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 허깅챗.. 2024. 4. 3.

생성형 AI가 바꾸는 광고의 미래! 영향 분석 및 최신 동향 안녕하세요! 최근 급격하게 발전하는 생성형 인공지능 기술은 다양한 산업 분야에 혁명적인 변화를 가져오고 있는데요. 광고 제작 분야도 예외는 아닙니다. 생성형 AI를 이용한 광고 제작은 창의적이고 혁신적인 콘텐츠의 제작과 효율성 향상, 비용 및 시간 절감, 데이터 기반 타겟팅과 개인화 등 긍정적인 측면이 있지만 동시에, 개인정보 보호 및 보안에 대한 우려와 딥 페이크, 알고리즘 불균형으로 인한 편향 우려 등 부정적인 측면도 존재합니다. 이 블로그에서는 생성형 AI가 광고제작에 미치는 영향과 AI 광고 플랫폼의 최신 동향에 대해 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 생성형 AI가 광고에 미치는 영향 먼저, 생성형 AI가 광고제작에 미치는 .. 2024. 4. 2.

스테이블 디퓨전보다 28배 빠른 DMD 기술, 1장당 0.05초! 안녕하세요! 오늘은 현존하는 이미지 생성 AI 중 가장 빠른 속도를 구현한 DMD(Distribution Matching Distillation, 분포 매칭 증류) 기술에 대해서 알아보겠습니다. DMD는 확산 모델(Diffusion Model)의 다단계 프로세스를 단일 단계로 단순화하는 방식으로 논문에 따르면 스테이블 디퓨전 1.5가 이미지 1장을 생성하는데 1.4초 걸리는 반면, DMD는 더 우수한 품질을 생성하면서도 이보다 약 28배 빠른 0.05초가 걸린다고 합니다. 이 블로그에서는 DMD 기술의 개요, 아키텍처, 동작원리, 성능에 대해서 살펴보겠습니다. https://www.aitimes.com/news/articleView.html?idxno=158253 MIT "모든 이미지 생성 AI 중 가장.. 2024. 3. 29.

PraisonAI: 명령어 1줄! 코드 없이 AI 에이전트로 영화 대본 만들기 안녕하세요! 오늘은 PraisonAI라는 AI 에이전트 활용도구를 이용해서 명령어 한 줄로 영화대본을 생성해 보겠습니다. PraisonAI는 프로그래머 Mervin Praison이 만들어서 유튜브에 공개한 프로그램으로 코드작업 없이 CrewAI와 Autogen의 기능을 통합한 툴입니다. PraisonAI는 .yaml 파일을 이용하여 프레임워크 선택, 사용자 명령입력, 에이전트 역할 및 목표와 같은 설정을 텍스트 형태로 입력하여 설정할 수 있습니다. 이 블로그에서는 PraisonAI의 개요 및 구성요소, 주요 기능을 살펴보고 영화대본 생성예제를 실행해 보겠습니다. https://github.com/MervinPraison/PraisonAI/ GitHub - MervinPraison/praisonAI: pr.. 2024. 3. 28.

구글 VLOGGER: 이미지 1장과 음성으로 움직이는 아바타를 만드는 방법 안녕하세요! 오늘은 구글의 단일 이미지 입력 및 오디오 기반 비디오 생성기술인 VLOGGER에 대해서 알아보겠습니다. VLOGGER는 인간의 얼굴과 몸의 다양한 표현을 사용하여 길이가 가변적인 고품질 비디오를 생성하는 과정에서 각 개인별로 별도의 훈련이 필요하지 않으며, 얼굴이나 입술뿐만 아니라 완전한 이미지를 생성하고, 다양한 상황에서 의사 소통하는 모습을 합성할 수 있습니다. 이 블로그에서는 VLOGGER의 파이프라인 구조과 동작원리, MENTOR 데이터셋 등에 대해서 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 이 논문의 목적은 주어진 오디오와 단일 입력 이미지를 활용하여 사람의 현실적인 영상을 생성하는 새로운 프레임워크인 V.. 2024. 3. 27.

LATTE3D: 엔비디아의 새로운 텍스트 기반 3D 생성 기술 안녕하세요! 오늘은 AI와 GPU 분야의 최강자, 엔비디아의 새로운 텍스트 기반 3D 생성기술, LATTE3D에 대해서 알아보겠습니다. 이 연구는 최적화 과정이 매우 시간이 소요되며 대규모 프롬프트 세트에 대한 일관된 성능을 보이지 못하는 텍스트 기반 3D 생성 기술의 한계를 극복하고 빠르고 효율적인 3D 모델 생성을 위한 새로운 방법을 제안합니다. 이 블로그에서는 LATTE3D의 개요와 특징, 아키텍처, 동작원리 등에 대해서 알아보고 DEMO 사이트를 소개해드리겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 이 논문의 목적은 텍스트를 기반으로 한 3D 생성 모델의 일반화 및 효율성을 향상시키는 것입니다. 이를 위해 연구는 LATTE3D (.. 2024. 3. 25.

오픈소스 AI 엔지니어 Devika 체험: 계획-검색-코딩 자동화 성공! 안녕하세요! 오늘은 Devika라는 AI 소프트웨어 엔지니어를 만나보겠습니다. Devika는 오픈소스 AI 소프트웨어 엔진으로, 고수준의 인간 지시를 이해하고 단계별로 실행 가능한 작업으로 분해하여 관련 정보를 조사하고 코드를 생성하는 능력을 갖추고 있습니다. 이 블로그에서는 Devika의 개요와 주요 기능을 알아보고 Devika에게 스네이크 게임개발과 정보검색 및 요약 작업을 요청해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Devika 개요 및 주요 기능 Devika는 최근 공개된 Cognition AI의 Devin을 모델로 하였으며, Devin의 대안을 제공하고 SWE-bench 벤치마크에서 Devin과 동일한 점수를 달성하는 목표를 가지.. 2024. 3. 24.

🛠️📈Cohere: 쿼리 없이 데이터베이스와 AI로 대화하는 방법 안녕하세요! 오늘은 Cohere라는 대형 언어 모델 기반 응용 프로그램 구축 플랫폼에 대해서 알아보겠습니다. Cohere는 Command-R이라는 언어 모델을 통해 대화형 도구 사용, 검색 및 RAG(검색 증강 생성) 시스템 개선, Fine-Tuned 모델 생성 등 다양한 기능을 제공합니다. 또한, Cohere는 API나 클라우드 등의 다양한 접근 방식을 통해 사용자가 편리하게 접근할 수 있으며, 한국어를 포함한 10개 주요 언어를 지원합니다. 이 블로그에서는 Cohere의 개요와 특징, Sqlite DB와 AI 애플리케이션의 통합 예제에 대해서 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Cohere와 Command-R Cohere는 대규모.. 2024. 3. 23.

Ultralytics YOLO v8: 누구나 손쉽게 할 수 있는 컴퓨터 비전 작업 솔루션 안녕하세요! 오늘은 다양한 컴퓨터 비전 작업을 지원하는 AI 프레임워크인 Ultralytics YOLO에 대해서 알아보겠습니다. YOLO는 이미지나 비디오에서 객체의 인식과 분류, 세분화, 객체 추적, 포즈 추정 등과 같은 다양한 비전 작업 수행이 가능한 솔루션입니다. 이 블로그에서는 Ultralytics YOLO 개요와 기능에 대해 알아보고, 이미지와 비디오에서의 객체인식 및 보행자 동선추적, 실시간 차량속도 추정, 교통 흐름 분석 예제를 살펴보겠습니다. https://github.com/ultralytics/ultralytics GitHub - ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite N.. 2024. 3. 22.

MM1: 애플의 새로운 멀티모달 언어 모델 안녕하세요! 오늘은 최근 애플에서 공개한 MM1이라는 이미지-투-텍스트, 멀티모달 언어 모델(Multimodal Language Model, MMLM)에 대해서 알아보겠습니다. MM1은 이미지 캡셔닝, 이미지에 대한 질문에 답하기 등 이미지와 관련된 텍스트를 생성하거나 이해하는 작업에 사용될 수 있으며, 다중 이미지 추론, 텍스트 기반 시각 질문 응답 등에서 우수한 성능을 나타냅니다. 이 블로그에서는 논문을 통해 MM1 개요와 특징, 실험 및 구축방법, 성능평가 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 이 논문은 멀티모달 언어 모델(MMLM) 분야에서 우수한 성능을 가진 MM1 모델을 제시합니다. MM1 모델은 다양.. 2024. 3. 21.

5줄 파이썬 코드로 AI 주식 분석 완료! Hermes 2 Pro의 놀라운 함수 호출 기능 안녕하세요! 오늘은 최신 대규모 언어 모델 Hermes-2-Pro-Mistral-7B에 대해서 알아보겠습니다. Hermes-2-Pro-Mistral-7B는 NousResearch가 개발한 미스트랄(Mistral) 아키텍처 기반 대규모 언어 모델로, 함수호출과 JSON 출력에서 높은 성능과 다양한 자연어 이해 기능을 제공합니다. 이 블로그에서는 Hermes 2 Pro 개요와 특징, 파이썬 코드 5줄로 완성하는 주식분석 예제코드에 대해서 알아보겠습니다. https://huggingface.co/NousResearch/Hermes-2-Pro-Mistral-7B NousResearch/Hermes-2-Pro-3 Face Hermes 2 Pro - Mistral 7B Model Description Hermes .. 2024. 3. 19.

🚀Groq API와 Streamlit으로 만드는 슈퍼 패스트 웹사이트 URL 채팅봇! 안녕하세요! 오늘은 초당 500 토큰 이상의 추론 가속성능을 가진 Groq API와 파이썬 라이브러리 Streamlit을 활용해서 웹사이트 URL입력으로 내용을 빠르게 파악하고 대화하는 웹 페이지를 만들어보겠습니다. Streamlit은 데이터 처리, 시각화, 인터랙션 등을 수행하고, 이를 웹 브라우저에서 실시간으로 확인할 수 있 웹 애플리케이션 프레임워크입니다. Streamlit을 활용하면 같은 화면에서 URL만 바꿔서 입력하여 바로 응답을 얻을 수 있습니다. 이 블로그에서는 Groq API와 Streamlit을 활용해서 웹사이트 URL 채팅봇을 만들어 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Groq API, Streamlit 개요 Groq.. 2024. 3. 16.

피규어(Figure) 01: 인간 같은 휴머노이드 로봇의 미래 안녕하세요! 오늘은 오픈AI의 동영상 생성 AI Sora에 이은 또 하나의 혁신적인 AI, 피규어 01 로봇에 대해서 알아보겠습니다. 피규어 01은 OpenAI와 캘리포니아의 스타트업 회사 피규어 AI와의 파트너십을 통해 만들어진 인공지능 휴머노이드 로봇입니다. 이 블로그에서는 피규어 01 로봇의 개요, 기술적인 특성과 작동원리, DEMO 영상에 대해서 알아보겠습니다. https://www.aitimes.com/news/articleView.html?idxno=157964 피규어 AI, 인간과 대화하며 작업하는 휴머노이드 공개..."SF가 현실로" - AI타임스 인공지능(AI) 로봇 스타트업 피규어 AI가 오픈AI와 협력해 만든 휴머노이드 로봇 영상을 공개했다. 사람의 질문과 요청을 정확히 이해하고 답변.. 2024. 3. 15.

🚀 Groq LPU에 날개를 달아주는 FunckyCall 프록시 서버 완벽 가이드 안녕하세요! 오늘은 최근 혁신적인 추론속도로 주목받고 있는 Groq의 LPU 언어 모델이 인터넷 검색과 같은 다양한 함수처리 기능을 통합할 수 있도록 지원하는 FunckyCall이라는 프록시 서버에 대해 알아보겠습니다. FunckyCall 프록시 서버는 사용자의 요청을 받아서 대형 언어 모델이 직접 처리할 수 없는 함수를 대신 호출, 처리하여 프로그램에 통합하고, 이를 통해 코드 관리, 간소화, 서비스 통합, 확장성, 성능 및 안정성 측면에서 다양한 장점을 제공합니다. 이 블로그에서는 FunckyCall 프록시 서버의 기능, 사용방법, 동작원리, 예제코드에 대해서 알아보겠습니다. https://funckycall.ai/ FunckyCall FunckyCall.ai FunckyCall is a proxy .. 2024. 3. 14.

MusicLang: 대형 언어 모델로 누구나 쉽게 MIDI 음악 작곡하기 안녕하세요! 오늘은 MusicLang이라는 음악 작곡 및 분석을 위한 대형 언어 모델과 파이썬 프레임워크를 이용해서 나만의 MIDI 음악을 작곡해 보겠습니다. MusicLang은 작곡가가 음악을 로드하고 작성하며, 변환하고 예측하는 데 사용할 수 있는 새로운 언어를 구현함으로써 손쉽게 높은 퀄리티의 MIDI 음악을 다룰 수 있도록 지원합니다. 이 블로그에서는 MusicLang 언어모델과 라이브러리 활용방법, 무작위 음악, 코드진행 음악 등 MIDI 음악 생성예제에 대해서 알아보겠습니다. https://www.musiclang.io/ MusicLang . MusicLang is Revolutionising Music Creation with AI. Made for artists & by artists. w.. 2024. 3. 13.

[꿀팁] 비행기 모드 AI 채팅! MLCChat으로 스마트폰 데이터 연결 없이 AI 즐기기 안녕하세요! 오늘은 "MLCChat"이라는 앱을 이용해서 데이터 연결 없이 스마트폰에서 대형 언어 모델과 대화하는 방법에 대해 알아보겠습니다. MLCChat(Machine Learning Chat)은 웹, iOS 및 Android 등 다양한 플랫폼에서 대규모 언어 모델을 실행할 수 있도록 지원하는 MLC LLM(Machine Learning Compilation for Large Language Models) 프로젝트의 일부로써, MLC LLM에서 컴파일하고 변환한 대형 언어 모델을 이용해서 대화형 인터페이스를 구현한 프로그램입니다. 이 블로그에서는 MLC LLM의 개요와 MLCChat DEMO 앱 설치 및 사용방법에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액.. 2024. 3. 10.

클로드(Claude) Sonnet을 이용한 고객리뷰 분류 및 요약 자동화 안녕하세요! 오늘은 최근 공개된 클로드 Sonnet 모델을 이용해서 고객의 리뷰를 자동으로 분류하고 요약해 보겠습니다. 수많은 고객의 리뷰를 모두 읽어보고 요약해서 인사이트를 얻으려면 많은 시간과 노력이 필요하지만 구글 스프레드 시트의 확장프로그램인 "Claude for Sheets"를 활용하면 대형 언어 모델의 추론 기능을 통해 수많은 고객 리뷰를 단시간에 요약하고 대책을 수립할 수 있습니다. 이 블로그에서는 "Claude for Sheets"의 설치 및 사용방법을 알아보고 이를 활용한 영한번역과 고객리뷰 자동분류 및 요약 예제에 대해서 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Claude for Sheets 설치 Claude for S.. 2024. 3. 7.

클로드(Claude) 3: GPT-4와 제미나이를 뛰어넘은 언어 모델의 등장! 안녕하세요! 오늘은 3월 4일 발표된 앤트로픽의 최신 대형 언어 모델 클로드(Claude) 3에 대해서 알아보겠습니다. 이번에 발표된 클로드 3 모델 패밀리는 Haiku, Sonnet 및 Opus라는 세 가지 최신 모델로 구성되어 있으며, 그중 Opus는 인공지능 시스템의 일반적인 평가 기준에서 GPT-4, Gemini 등 기존 모델들을 능가하는 벤치마크 결과를 공개하였습니다. 이 블로그에서는 클로드 3의 개요와 특징에 대해 알아보고, 클로드 3 API를 활용한 함수 호출 예제에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 클로드 3 개요 및 특징 클로드 3 모델은 분석 및 예측, 코드 생성 및 스페인어, 일본어 및 프랑스어와 같은 비영.. 2024. 3. 6.

[Ollama 활용] 허깅페이스 Solar를 나만의 커스텀 언어 모델로 바꾸기 안녕하세요! 오늘은 대형 언어 모델 도구 Ollama를 이용해서 커스텀 언어 모델을 만들어 보겠습니다. 커스텀 언어 모델은 시스템 프롬프트 등을 변경하여 사용자가 원하는 방식으로 동작하도록 조정한 언어 모델을 말합니다. 이 블로그에서는 허깅페이스 대형 언어 모델을 OpenAI 호환기능, Langchain, 파이썬, 자바스크립트 등의 활용이 가능한 Ollama 로컬 모델로 변환하고, 시스템 프롬프트를 변경해서 커스텀 언어 모델을 만드는 방법에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 허깅페이스 모델 가져오기 먼저 커스텀 언어 모델을 만들기 위해 기본이 되는 모델을 허깅페이스에서 가져오겠습니다. 제가 선택한 모델은 국내기업 업스테이지의 .. 2024. 3. 5.

🚀Unsloth : 메모리 60% 절약, 훈련 속도 30배 향상! 나만의 LLM 만들기 안녕하세요! 오늘은 Unsloth라는 대형 언어 모델 훈련도구에 대해서 알아보겠습니다. Unsloth는 메모리를 효율적으로 사용하여 대형 언어 모델을 더 빠르게 훈련시킬 수 있도록 지원하는 도구입니다. 해당 도구는 PyTorch를 기반으로 하며, 주로 CUDA를 사용하는 NVIDIA GPU에서 작동합니다. 이 블로그에서는 Unsloth의 기능과 특징, 설치방법, 코랩을 이용한 LLM 훈련 및 로컬 저장방법 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Unsloth란? Unsloth는 LLM(대규모 언어 모델)의 훈련을 최적화하기 위한 도구입니다. 이 도구는 훈련 속도를 높이고 메모리 사용량을 줄이며 정확성을 유지하거나 향상시킬 수.. 2024. 3. 3.

Groq LPU : 논문 한편 요약하는데 입력-추론-응답까지 2.4초! 안녕하세요! 오늘은 Groq이라는 회사의 대형 언어 모델 추론성능 가속장치, LPU(Language Processing Unit)에 대해서 알아보겠습니다. Groq은 2016년에 과거 구글 직원이었던 조나단 로스에 의해 설립된 AI 솔루션 회사인데요. 세계 최초로 대형 언어 모델의 처리속도 가속화 위해 특별히 설계된 LPU(Language Processing Unit)라는 사용자 정의 칩을 개발하였습니다. 이 블로그에서는 Groq LPU의 특징, 성능 등에 대해서 알아보고 Groq 클라우드 플레이 그라운드와 Groq API 사용방법에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Groq LPU란? Groq LPU(Language Pro.. 2024. 2. 29.

이전 1 ··· 3 4 5 6 7 8 9 ··· 12 다음

티스토리툴바