본문 바로가기
728x90

전체 글317

🎨ComfyUI + Gemini + Ollama + Flux: 이미지 및 프롬프트 자동 생성하기 안녕하세요! 오늘은 ComfyUI, Gemini, Ollama, Flux를 조합해서 원하는 이미지와 프롬프트를 자동으로 생성하는 방법을 알아보겠습니다. 이 방법을 사용하면, 인터넷상의 이미지 URL 주소만 입력하면 Gemini가 자동으로 해당 이미지를 만들기 위한 영문 프롬프트를 생성하고, 이 프롬프트를 연결해서 Flux로 이미지를 생성할 수 있습니다. 또한, 몇 가지 키워드만 입력해도 Ollama 로컬 AI가 최적의 이미지 생성 프롬프트를 만들어줍니다. 이 블로그에서는 "Gemini in ComfyUI"와 "ComfyUI Ollama" 커스텀 노드를 이용한 이미지 및 프롬프트 자동 생성방법에 대해 알아보겠습니다."이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."G.. 2024. 8. 19.
🔥Llamafile: 📁파일 하나로 대규모 언어 모델 로컬 실행과 배포! 안녕하세요! 오늘은 대규모 언어 모델을 하나의 파일로 실행하고 배포할 수 있도록 해주는 Llamafile에 대해서 알아보겠습니다. Llamafile은 Firefox 웹 브라우저로 유명한 Mozilla에서 만든 대규모 언어 모델 도구로서 복잡한 설치 과정 없이도 대부분의 컴퓨터에서 로컬로 실행할 수 있으며, 개발자와 일반 사용자가 오픈 LLM을 쉽게 접근할 수 있도록 해줍니다. 이 블로그에서는 Llamafile의 개요와 동작원리, 주요 기능, 생성방법과 Ollama 모델 실행방법에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Llamafile 개요Llamafile은 단일 파일로 대규모 언어 모델(LLM)을 실행하고 배포할 수 있는 혁신적인 .. 2024. 8. 13.
🚀EXAONE 3.0 7.8B 리뷰: LG AI 연구소의 혁신적인 언어 모델 안녕하세요! 오늘은 LG AI 연구소에서 개발한 최첨단 대형 언어 모델, EXAONE 3.0에 대해 알아보겠습니다. EXAONE은 "EXpert AI for EveryONE"이라는 비전을 가지고 인공지능 기술을 통해 전문가 수준의 능력을 대중에게 제공하는 것을 목표로 개발되었으며 , 특히 한국어에서 뛰어난 성능을 보일뿐 아니라, 영어를 포함한 다양한 언어에서도 경쟁력 있는 성과를 보여줍니다. 이 모델은 다양한 크기로 제공되며, 이번에 공개된 7.8B 모델은 비상업적 연구 목적으로 사용할 수 있도록 공개되었습니다. 이 블로그에서는 EXAONE 3.0의 개요, 특징 및 주요 기능과 성능평가 결과에 대해 살펴보겠습니다."이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."E.. 2024. 8. 11.
🎨Flux Dev FP8 버전: 저사양 GPU로 Flux를 무료로 즐기세요! 안녕하세요! 오늘은 요즘 가장 핫한 이미지 생성모델 Flux.1에 대해 알아보는 두 번째 시간입니다. 지난 시간에는 모델의 크기가 23GB로 너무 커서 직접 로컬에서 실행하지 못하고 API 방식으로 이미지를 생성해 보았는데요. 오늘은 모델의 크기를 30% 이상 축소한 메모리 최적화 버전을 사용해서 ComfyUI를 통해 직접 이미지를 생성해 보겠습니다. 메모리 최적화 버전은 원본보다 결과물의 정밀도는 약간 낮지만, 이미지 품질이 나쁘지 않아서 GPU 사양이 낮은 분들도 따라 해 보시면 좋을 것 같습니다. 이 블로그에서는 Flux Dev FP8 메모리 최적화 버전의 설치방법과 ComfyUI를 이용한 이미지 생성방법에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수.. 2024. 8. 9.
🚀최고의 이미지 생성 모델! Flux.1: GPU 스트레스 없는 API 방식 가이드 안녕하세요! 오늘은 독일의 스타트업 Black Forest Labs가 개발한 고품질 이미지 생성 모델 FLUX.1에 대해 알아보겠습니다. Stable Diffusion의 창시자들이 설립한 회사인 Black Forest Labs는 FLUX.1의 개발을 위해 3,100만 달러의 자금을 확보하였으며, 이 모델은 텍스트를 기반으로 고품질 이미지를 생성하는 데 특화되어 개발되었습니다. 또한 Flux.1은 오픈소스 모델로 제공되어 개발자들이 자유롭게 사용할 수 있습니다. 이 블로그에서는 Flux.1의 개요, 특징 및 주요 기능에 대해 알아보고, GPU 스트레스 없이 API 방식으로 이미지를 생성하는 방법에 대해 알아보겠습니다."이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.".. 2024. 8. 4.
✨Gemini 1.5 프로 실험 버전: GPT-4o를 제치고 챗봇 아레나 1위! 안녕하세요! 오늘은 2024년 8월 1일, 구글이 공개한 최신 AI 모델, Gemini 1.5 프로 실험 버전(0801)에 대해서 알아보겠습니다. 이 모델은 사용자가 각 챗봇의 응답을 익명으로 평가하는 LMSYS 챗봇 아레나의 리더보드에서 오랜 기간 동안 최고 자리를 지켜온 OpenAI ChatGPT-4o와 Claude 3.5 Sonnet을 제치고 새로운 벤치마크 1위의 기록을 세웠습니다. 이번 블로그에서는 Gemini 1.5 프로의 개요, 벤치마크 결과에 대해 살펴보고, 자체적으로 코딩 및 추론테스트를 해보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Gemini 1.5 프로 실험 버전(0801) 개요 Gemini 1.5 프로 모델은 구글의 최신 A.. 2024. 8. 3.
Morphic: 🔍질문을 잘 이해하는 생성형 UI 기반 검색 엔진의 혁신 안녕하세요! 오늘은 AI 기술을 활용한 혁신적인 검색 엔진, Morphic에 대해 알아보겠습니다. Morphic는 자연어 처리(NLP)와 생성적 AI 기술을 결합하여 사용자가 입력한 쿼리를 이해하고, 그에 맞는 최적의 결과를 제공함으로써, 사용자에게 보다 직관적이고 개인화된 검색 경험을 제공합니다. 또한 특정 URL에서 정보를 추출할 수 있고, 다양한 AI 제공업체의 모델을 지원하여 사용자는 더욱 정확하고 관련성 높은 정보를 제공받을수 있습니다. 이 블로그에서는 깃허브 5k 스타를 받고있는 Morphic의 개요, 특징 및 주요 기능과 설치방법에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Morphic 개요 Morphic은 AI 기술을 활.. 2024. 8. 2.
Open-WebUI: 🔍실시간 웹 검색과 개인 메모리 기능을 갖춘 LLM 실행기 안녕하세요! 오늘은 최근 엡데이트 된 언어모델 실행을 위한 웹 인터페이스, Open WebUI에 대해 알아보겠습니다. Open WebUI는 풍부한 기능과 사용하기 쉬운 인터페이스를 제공하며, 온라인 오프라인 AI 모델관리, 개인 메모리 관리와 인터넷 검색 등 다양한 기능을 제공하는 오픈소스 언어 모델(LLM) 실행기입니다. 이 블로그에서는 Open WebUI의 개요와 주요 기능, 설치방법, 그리고 개인 메모리 관리 및 인터넷 검색 설정방법을 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Open WebUI 개요 및 특징Open WebUI는 완전 오프라인으로 작동할 수 있는 셀프 호스팅 웹 UI로, Ollama 및 OpenAI 호환 API를 비롯한.. 2024. 7. 31.
🛠️ Ollama Tool 기능 가이드: 로컬 AI로 날씨 조회부터 웹 검색까지 안녕하세요! 오늘은 최근 업데이트된 Ollama의 Tool 기능에 대해 살펴보겠습니다. Tool 지원 기능은 AI 모델들이 더 복잡한 작업을 수행하고 외부 세계와 상호 작용할 수 있도록 해주는 역할을 하며, Ollama는 Llama 3.1, Mistral Nemo와 같은 최신 인기 AI 모델을 통해 다양한 도구를 호출할 수 있도록 지원하고, 이를 통해 모델은 주어진 프롬프트에 대해 알고 있는 도구를 사용하여 더욱 정확하고 유용한 답변을 제공할 수 있습니다. 이 블로그에서는 Ollama Tool 기능의 개요와 지원모델에 대해 알아보고, 로컬 AI 모델, Mistral Nemo를 통해 날씨와 인터넷 정보를 검색하는 예제를 구현해 보겠습니다. https://ollama.com/blog/tool-support .. 2024. 7. 28.
🧠 최강 AI 검색 비서: Mistral Large 2 모델 설정 가이드 안녕하세요! 오늘은 뛰어난 한국어와 명쾌한 추론 능력으로 관심을 모으로 있는 Mistral Large 2 모델을 브라우저 사이드바에 고정해서 인터넷 검색 비서로 활용하는 방법을 알아보겠습니다. 이전 블로그에서 알아보았듯이 Mistral Large 2는 다양한 코딩 언어와 다국어 지원은 물론 논리적 추론 성능도 매우 뛰어난 모델로서, 123B의 매개변수로 Llama 3.1 405B의 성능과 동등한 수준을 보입니다. 이 블로그에서는 Mistral Large 2 모델을 웹 브라우저 사이드바에 고정해서 필요할때마다 검색비서로 활용하는 방법을 구현해보겠습니다.2024.07.26 - [AI 언어 모델] - 🚀Mistral Large 2 리뷰: 유창한 한국어와 뛰어난 추론 능력의 코딩 AI 🚀Mistral Lar.. 2024. 7. 26.
🚀Mistral Large 2 리뷰: 유창한 한국어와 뛰어난 추론 능력의 코딩 AI 안녕하세요! 오늘은 미스트랄의 최신 대형 언어 모델 Mistral Large 2에 대해서 알아보겠습니다. 123B(1230억 개)의 파라미터와 128k 컨텍스트 윈도우를 갖춘 Mistral Large 2는 코드 생성, 수학, 추론 능력에서 이전 모델보다 뛰어나며, 다국어 지원과 고급 함수 호출 기능이 향상된 차세대 AI 모델로, 연구 및 비상업적 용도로 무료로 제공됩니다. 이 블로그에서는 MIstral Large 2 모델의 개요 및 특징, 벤치마크 결과에 대해 알아보고 코딩 및 추론성능 테스트를 해보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Mistral Large 2 개요미스트랄의 새로운 세대의 주력 모델, Mistral Large 2는 코드 생.. 2024. 7. 26.
🚀 Llama 3.1: Meta의 최강 오픈소스 AI 모델 출시! 📈 안녕하세요! 오늘은 Meta에서 공개한 최신 언어모델 Llama 3.1에 대해서 알아보겠습니다. Llama 3.1은 8B, 70B, 405B 세 종류의 매개변수로 출시되었으며, 128K 문맥 길이와 8개 언어 지원을 특징으로 하는 오픈 소스 AI 모델로, 합성 데이터 생성, 모델 증류, 실시간 및 배치 추론,  호출, 지속적 사전 훈련 등을 지원하며, Llama Guard 3와 Prompt Guard를 포함한 안전 도구를 제공하고, Llama 스택 API를 통해 개발자들이 쉽게 활용할 수 있습니다. 이 블로그에서는 Llama 3.1의 개요, 주요 특징 및 아키텍처 등을 살펴보고, Llama 3.1 70B 모델의 코딩 및 추론성능을 테스트해 보겠습니다. https://ai.meta.com/blog/meta.. 2024. 7. 24.
🔍 Llama-3-Groq 최신 AI 모델로 브라우저 사이드바 웹 검색 구현하기 안녕하세요! 오늘은 Groq의 최신 오픈소스 대형 언어 모델,  Llama-3-Groq-Tool-Use(이하, Llama-3-Groq)에 대해 알아보겠습니다. Llama-3-Groq 모델은 Groq의 고성능 AI 하드웨어 가속기를 활용하여 빠르고 효율적인 추론을 지원하며, 복잡한 자연어 처리 작업, 수학적 계산, 웹 검색 등의 도구 사용 및 함수 호출 기능에서 탁월한 성능을 자랑합니다. 이 블로그에서는 Llama-3-Groq 모델의 개요, 주요 기능, 벤치마크 결과를 살펴보고, 이 모델을 이용한 인터넷 검색 기능을 네이버 웨일 브라우저의 사이드바에 구현해 보겠습니다.https://www.aitimes.com/news/articleView.html?idxno=161746 그로크, AI 에이전트용 오픈 소스.. 2024. 7. 23.
Mistral NeMo: 🚀128k 긴 텍스트와 다국어 지원 미스트랄 최신 모델 안녕하세요! 오늘은 미스트랄이 Codestral Mamba에 이어 내놓은 또 하나의 AI 모델, Mistral NeMo에 대해 알아보겠습니다. Mistral NeMo는 최대 128k 토큰의 문맥 창을 제공하여 긴 텍스트도 처리할 수 있으며, 영어, 프랑스어, 한국어 등 다양한 언어를 지원합니다. 새로운 Tekken 토크나이저는 100개 이상의 언어에서 훈련되어 자연어 텍스트와 소스 코드를 효율적으로 압축하며, 한국어와 아랍어에서 특히 효율적입니다. 또한, 고도화된 지시 조정 기능을 통해 명령 수행, 논리적 추론, 다중 턴 대화 처리 및 코드 생성에 뛰어난 성능을 보입니다. 이 블로그에서는 Mistral NeMo의 개요, 특징 및 주요 기능에 대해 알아보고, 코딩 및 추론 테스트를 진행해 보겠습니다. "이.. 2024. 7. 20.
🚀 GPT-4o mini: OpenAI의 최첨단 고성능 저비용 AI 모델 안녕하세요! 오늘은 OpenAI의 가장 비용 효율적인 소형 모델, GPT-4o mini에 대해서 알아보겠습니다. GPT-4o mini는 입력 토큰 백만 개당 15센트, 출력 토큰 백만 개당 60센트로 가격이 책정되어 있으며, 이는 GPT-3.5 Turbo보다 60% 이상 저렴한 가격으로, 이전의 최첨단 모델 GPT-4o보다 훨씬 저렴하게 다양한 응용 프로그램을 구축할 수 있습니다. 이 블로그에서는 GPT-4o mini 개요, 특징 및 주요 기능에 대해 알아보고 코딩 및 추론 테스트를 해보겠습니다."이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."GPT-4o mini 개요 GPT-4o mini는 128K 토큰의 컨텍스트 윈도우와 최대 16K 출력 토큰을 지원하며, 저.. 2024. 7. 20.
미스트랄 Codestral Mamba:🐍Mamba 아키텍처로 무장한 코드 생성 AI 안녕하세요! 오늘은 미스트랄의 새로운 코드 생성 언어 모델, Codestral Mamba에 대해서 알아보겠습니다. Codestral Mamba는 프랑스의 Mistral AI 팀이 개발한 Mixtral 패밀리의 후속작으로, 특히 코드 생산성에 초점을 맞춘 모델입니다.  Transformer 모델과 달리 Mamba 모델은 선형 시간 추론을 통해 이론적으로 무한 길이의 시퀀스를 모델링함으로써, 입력 길이에 상관없이 빠른 응답을 보장합니다. 또한 Apache 2.0 라이선스를 통해 누구나 자유롭게 사용, 수정, 배포할 수 있습니다. 이 블로그에서는 Codestral Mamba의 개요와 Mamba 아키텍처에 대해 알아보고, 성능테스트 및 간단한 챗봇을 만들어 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으.. 2024. 7. 18.
PraisonAI Code: AI 코딩 혁신! 이젠 전체 코드 베이스와 대화하세요!(feat. 제미나이) 💬🚀 안녕하세요! 오늘은 구글 제미나이 모델을 활용해서 전체 코드 프로젝트와 대화하는 PraisonAI Code에 대해서 알아보겠습니다. PraisonAI Code는 AI를 활용해 전체 코드베이스를 이해하고 자연어로 소통하며 더 빠르고 효율적으로 코딩할 수 있게 도와주는 혁신적인 도구로, LLM이 코드베이스를 실시간으로 업데이트하고 맥락을 파악하여 개발자가 코드와 상호작용하는 방식을 혁신적으로 바꿉니다. PraisonAI Code를 사용하면, 코드를 작성하거나 수정하는 과정에서 AI의 도움을 받아 생산성을 크게 향상시킬 수 있습니다. 이 블로그에서는 PraisonAI Code의 개요, 주요 기능, 설치방법에 대해 알아보고, DEMO를 진행해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른.. 2024. 7. 16.
[최신 AI 논문]🤖Mobility VLA: 구글의 스마트한 멀티모달 내비게이션 기술 안녕하세요! 오늘은 구글 딥마인드에서 개발한 Mobility VLA 로봇시스템에 대해 알아보겠습니다. Mobility VLA는 멀티모달 지시 내비게이션을 위한 로봇 시스템으로, 텍스트, 이미지, 음성 등 다양한 형태의 입력을 이해하고 처리할 수 있으며, 실제 환경에서의 시연 투어를 통해 학습하며, 복잡한 내비게이션 작업을 수행할 수 있습니다. 예를 들어, 사용자가 "이것을 어디에 반납해야 하나요?"라고 묻고 플라스틱 통을 보여주면, 로봇은 해당 물건을 반납할 수 있는 선반으로 안내할 수 있습니다. 이 블로그에서는 Mobility VLA의 개요, 특징 및 주요 기능, 동작원리 등에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."논문 개요Mob.. 2024. 7. 13.
🤖STORM: AI로 논문 작성하기,📈주제만 입력하면 고품질 리포트 3분 완성! 안녕하세요! 오늘은 대형 언어 모델을 활용해서 제목만 입력하면 인터넷 검색부터 고품질 보고서까지 자동으로 작성해 주는 STORM이라는 AI 도구를 소개해드리겠습니다. STORM(Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking, 다각적 질문 생성과 검색을 통한 주제 개요 작성)은 미국 스탠포드 대학에서 만든 시스템으로 인터넷 검색을 기반으로 주제만 입력하면 약 30페이지 분량의 논문 수준 리포트를 작성하는 LLM(Large Language Model) 시스템입니다. 이 블로그에서는 STORM의 개요, 주요 기능 및 동작 원리, 사용 방법에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로,.. 2024. 7. 12.
🔒GPT4All: 로컬 환경에서 안전하게 LLM 실행하기 안녕하세요! 오늘은 로컬에서 대규모 언어 모델(LLM)을 실행할 수 있는 GPT4All 애플리케이션에 대해 알아보겠습니다. 최근 인공지능의 발전과 함께 LLM이 다양한 응용 분야에서 뛰어난 성능을 보여주고 있으며, 특히 자연어 처리(NLP) 분야에서 많은 주목을 받고 있지만, 대부분의 고성능 상용 LLM은 클라우드 기반으로 운영되며, 이는 데이터 프라이버시와 보안에 대한 우려를 불러일으킬 수 있습니다. GPT4All은 사용자의 데이터를 로컬에서 안전하게 처리하며, 다양한 하드웨어와 언어 모델을 지원하는 오픈소스 소프트웨어로, 사용자 맞춤형 설정과 높은 프라이버시를 보장합니다. 오늘 블로그에서는 GPT4All의 개요와 주요기능, 설정방법 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환.. 2024. 7. 9.
📊GraphRAG: 마이크로소프트의 그래프기반 RAG 접근법(feat. Ollama) 안녕하세요! 오늘은 마이크로소프트에서 개발한 최신 RAG 기술인 GraphRAG에 대해 알아보겠습니다. GraphRAG은 기존의 벡터 표현을 사용한 유사성 검색 방식과 달리, 엔티티와의 관계를 추출해 복잡한 정보 간의 연결을 이해하고, 지식 그래프를 활용한 구조적, 계층적 데이터 처리와 전역 및 지역 검색 기능을 통한 데이터셋 전반 및 특정 엔티티에 대한 정교한 질문 처리를 통해 기존의 RAG보다 뛰어난 질문 응답 성능을 제공합니다. 이 블로그에서는 GraphRAG의 개요 및 특징, 동작원리, 그리고 ollama를 이용한 설치 방법에 대해 알아보고 간단한 엔터티 그래프도 그려보겠습니다."이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."GraphRAG 개요 및 특징G.. 2024. 7. 7.
Brave 브라우저 AI 어시스턴트: Ollama와 LM Studio 활용법🚀🛡️🤖 안녕하세요! 오늘은 광고차단, 빌트인 VPN, 개인 검색 등 보안과 프라이버시를 강화한 Brave 웹 브라우저의 AI 어시스턴트, "Leo AI"에 대해 알아보겠습니다. Leo AI는 Brave 브라우저 내장 AI 어시스턴트로서, 웹페이지 요약, 콘텐츠 생성, 번역, 프로그래밍 지원, PDF 및 문서 분석 등을 도와줌으로써 효율적인 브라우징 환경을 지원합니다. 이 블로그에서는 Ollama와 LM Studio를 활용해서 Leo AI를 설정하고 사용하는 방법에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Leo AI 주요 기능Leo AI는 Brave 브라우저에 내장된 스마트 AI 어시스턴트로, 다양한 기능을 통해 사용자의 웹 탐색 경험을 향상.. 2024. 7. 4.
[Ollama 활용] 🤖AI 자동화로 손쉽게 앱 만들기: Maestro 설치 및 활용 안녕하세요! 오늘은 간단한 텍스트 입력으로 다양한 애플리케이션을 제작할 수 있는 자동화 도구 Maestro를 소개해 드리겠습니다. Maestro는 Claude 3.5 Sonnet, GPT-4o, Gemini 1.5 Pro 등과 같은 AI 모델을 활용하여 사용자가 요청하는 목표를 하위 작업으로 분해하고, 각 작업을 실행한 뒤 산출된 결과를 종합하는 프로세스를 자동화 하는 혁신적인 프레임워크입니다. 이 블로그에서는 Maestro의 주요 기능, 설치 방법 및 사용법에 대해 알아보고 실제로 메모앱, 스네이크 게임, 한-영 번역기를 만들어 보겠습니다.  "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Maestro 주요기능Maestro는 주어진 목표를 관리 가능한 하위 작.. 2024. 7. 2.
✨구글 Gemma 2 분석: 최신 오픈소스 모델로 무료 챗봇 만들기 🤖🔓 안녕하세요! 오늘은 구글의 최신 언어 모델 Gemma 2에 대해서 알아보겠습니다. Gemma 2는 2B, 9B, 27B 매개변수 모델을 제공하며, 최신 기술인 로컬-글로벌 어텐션 교차와 그룹 쿼리 어텐션을 도입했습니다. 지식 증류 기법을 적용해 작은 모델의 성능을 높였고, 동급 모델들을 능가하는 성능을 보이며, 오픈 소스로 공개되어 누구나 사용하고 연구할 수 있어 AI 기술의 접근성을 향상시켰습니다. 이 블로그에서는 Gemma 2의 개요, 로컬-글로벌 어텐션 교차와 그룹 쿼리 어텐션, 지식 증류에 대해 알아보고, 추론/코딩성능 테스트 및 Ollama를 이용한 Gemma 2 챗봇을 만들어 보겠습니다. ✨구글 Gemma 2 분석: 최신 오픈소스 모델로 무료 챗봇 만들기 🤖🔓"이 포스팅은 쿠팡 파트너스 활.. 2024. 6. 29.
🖥️마이크로소프트 Florence-2 리뷰: 0.7B 비전 모델의 혁신🚀 안녕하세요! 오늘은 마이크로소프트의 최신 비전 모델 Florence-2에 대해서 알아보겠습니다. 이 모델은 복잡한 공간적 계층 구조와 의미론적 세분화를 다루는 능력을 통해 객체 감지, 이미지 캡션 생성은 물론, 각 픽셀을 객체 또는 장면 범주로 분류하는 시맨틱 분할, 특정 구문과 관련된 영역을 식별하는 구문 분할, 객체가 있을 가능성이 높은 이미지 영역을 제안하는 영역 제안과 같은 다양한 시각 작업을 수행할 수 있습니다. 이 블로그에서는 Florence-2 모델의 개요 및 주요 특징, 동작리에 대해 알아보고 주요 기능에 대한 DEMO 테스트를 진행해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Florence-2 개요 및 특징Florence-2의 .. 2024. 6. 28.
🤖🆓ChatGPT-Artifacts: Claude 3.5 Sonnet의 아티팩트 기능이 무료! 안녕하세요! 오늘은 최근 공개된 앤트로픽의 언어 모델 Claude 3.5 Sonnet에서 공개된  새로운 기능인 아티팩트(Artifacts, 산출물) 기능을 오픈소스로 유사하게 구현한 ChatGPT-Artifacts라는 깃허브 프로젝트에 대해 살펴보겠습니다. 아티팩트는 사용자가 코드 스니펫, 텍스트 문서, 웹사이트 디자인 등을 요청하면, 대화창 옆 전용 창에 생성되는 콘텐츠를 실시간으로 보고, 편집하고, 자신의 프로젝트에 통합할 수 있는 동적 작업 공간입니다. 이 블로그에서는 ChatGPT-Artifacts의 기능과 설치방법에 대해 알아보고, 아티팩트 기능을 테스트해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."ChatGPT-Artifacts 기능.. 2024. 6. 25.
CoLLaVO: 카이스트의 최첨단 시각-언어 모델 분석 및 테스트👀💬🔍 안녕하세요! 오늘은 최근 카이스트에서 개발한 국산 시각-언어 모델 CoLLaVO에 대해 알아보겠습니다. CoLLaVO 모델은 입력 이미지를 분석하여 객체의 의미 정보와 위치 정보를 추출하는 역할을 하는 크레용 프롬프트(Crayon Prompt)를 사용한 팬옵틱 컬러 맵 (Panoptic Colormap) 기반 시각적 프롬프트와, Dual QLoRA 학습전략 구현을 통해, 다양한 비전-언어 태스크에서 뛰어난 제로샷 성능을 보여주며, 객체 인식과 복잡한 이미지 이해에서 탁월한 성과를 냅니다. 이 블로그에서는 CoLLaVO 모델의 개요, 동작원리 및 기술적 특성, 성능평가 결과에 대해 알아보고, 직접 모델에 이미지를 입력해서 텍스트 출력을 확인해 보겠습니다.https://v.daum.net/v/20240620.. 2024. 6. 25.
Claude 3.5 Sonnet: GPT-4o를 뛰어넘은 성능 및 새로운 인터페이스 Artifacts 리뷰 안녕하세요! 오늘은 엔트로픽의 최신 대형 언어 모델 Claude 3.5 Sonnet에 대해서 알아보겠습니다. 이 모델은 경쟁 모델들과 이전 버전인 Claude 3 Opus를 뛰어넘는 성능을 가지면서도, 중급 모델인 Claude 3 Sonnet의 속도와 비용 효율성을 유지하며, 특히 대학원 수준의 추론 능력(GPQA), 학부 수준의 지식(MMLU), 그리고 코딩 능력(HumanEval) 등에서 업계 최고 수준의 벤치마크를 기록했습니다. 이 블로그에서는 Claude 3.5 Sonnet 모델의 개요 및 특징, 주요 성능에 대해 살펴보고, 새로운 인터페이스인 Artifact 기능에 대해 알아보고, 추론성능과 코딩 성능을 테스트해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수.. 2024. 6. 22.
DeepSeek-Coder-V2: 현존 최강 AI 코딩 언어 모델 분석 및 테스트 안녕하세요! 오늘은 최신 코딩 언어 모델 DeepSeek-Coder-V2에 대해 알아보겠습니다. 이 모델은 수학적 추론과 코딩 능력 벤치마크에서 GPT-4-터보, Claude-3-Opus, Gemini-1.5-pro와 같은 고성능 상용 AI 모델을 앞서면서, 일반적인 자연어 처리 작업에서도 경쟁력 있는 성능을 보여줍니다. 또한 이 모델은 338개 프로그래밍 언어를 지원하고, 최대 문맥 길이가 128,000 토큰으로 확장되어 긴 코드와 복잡한 문제를 처리할 수 있습니다. 이 블로그에서는 DeepSeek-Coder-V2의 개요와 벤치마크 결과를 살펴보고, 파이썬 및 자바스크립트, PHP 코딩테스트를 통해 그 성능을 실제로 확인해 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 .. 2024. 6. 20.
Mesop: 파이썬으로 UI 제작, 초보도 5분이면 Ollama 챗봇 완성! 안녕하세요! 오늘은 구글의 새로운 사용자 인터페이스(UI) 제작 소프트웨어 Mesop을 소개해드리겠습니다. Mesop은 JavaScript, CSS, HTML 등 프론트엔드 지식 없이도 Python 함수로 직관적인 UI  컴포넌트를 작성할 수 있으며, 자동 새로고침과 강력한 개발 도구 지원으로 빠르게 작업을 수정하고 테스트할 수 있습니다. 이 블로그에서는 Mesop의 개요와 주요 기능 및 특징을 알아보고 Ollama 모델을 이용해서 Mesop 챗봇 프로그램을 만들어 보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."Mesop 개요Mesop은 Python 기반의 UI 프레임워크로, Python 함수로 텍스트 입력창, 버튼, 체크박스와 같은 UI 컴포넌트를.. 2024. 6. 18.
728x90