본문 바로가기
728x90

전체 글345

Fooocus 구글 Colab : GPU없이도 고퀄리티 이미지 생성 안녕하세요! 오늘은 강력한 이미지 생성 기능을 제공하는 Fooocus를 구글 클라우드에서 사용할 수 있는 구글 Colab 버전을 소개해드리겠습니다. Foooscus는 복잡한 프롬프트, 파라미터 설정, 워크플로우 작성과 같은 어려움 없이 누구나 간단한 프롬프트 만으로도 멋진 이미지 생성과 인/아웃페인팅, 업스케일, 베리에이션, 스타일, 이미지 프롬프트 등 다양한 기능을 가지고 있는 생성형 AI입니다. 이 블로그에서는 구글 Colab 개요와 Fooocus를 구글 Colab을 통해 사용하는 방법, Fooocus의 이미지 프롬프트 기능 등에 대해 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 구글 colab이란? 구글 Colab은 구글이 제공하는 클라.. 2024. 1. 18.
CrewAI: Llama2, Mistral, Orca2 협업으로 2024년 AI 트렌드 분석 안녕하세요! 오늘은 최근 핫한 AI도구인 CrewAI와 LM Studio, Ollama, JanAI LLM도구를 활용해서 Llama2, Mistral, Orca2 대규모 언어 모델의 협업을 통해 2024년 AI 기술트렌드에 대한 블로그를 자동으로 작성하는 프로젝트를 진행해 보겠습니다. 다양한 LLM 도구와 대규모 언어모델이 등장하는 이 블로그를 통해 CrewAI와 대규모 언어 모델 도구 LM Studio, Ollama, JanAI의 설치와 사용방법 등에 대해서 확인하실 수 있습니다. 프로젝트 개요 이 프로젝트는 가상의 연구 팀을 생성하고 각 팀원에게 특정 작업을 할당하여 2024년의 AI 기술 동향을 찾고, 데이터에서 핵심 인사이트를 도출하며, 블로그 콘텐츠를 작성하는 워크플로우를 구현합니다. 이 프로젝.. 2024. 1. 17.
AI 공모주 분석 : 우진엔텍, 발전소 계측제어설비 정비 전문기업 안녕하세요! 오늘은 1월 16일과 17일에 공모주 청약을 진행하는 우진엔텍에 대해서 알아보겠습니다. 우진엔텍은 국내 10개 발전소에 종합정비 솔루션을 제공하는 발전소 계측제어설비 정비 전문기업입니다. 이 블로그를 통해 우진엔텍의 회사개요와 경쟁력, 수요예측결과, 공모주 청약정보 등을 확인하실 수 있으며, 이 글은 ChatGPT와 구글 바드에게 증권신고서, 투자설명서, 회사 홈페이지 자료 등을 학습시켜 분석한 내용을 바탕으로 작성하였습니다. 회사개요 및 경쟁력 우진엔텍은 2013년 설립된 발전소 계측제어설비 정비 전문기업으로 원자력 및 화력발전소의 계측제어설비 경상정비, 계획예방정비 등 설비 진단, 성능 개선을 포함한 정비서비스와 국산 시스템의 개 및 공급 사업을 주력으로 하는 회사입니다. 우진엔텍의 정비.. 2024. 1. 15.
[AI 논문 분석] 트랜스포머 모델의 핵심기술, 어텐션 메커니즘 안녕하세요. 오늘은 자연어 처리 분야에서 혁신적인 변화를 가져온 주요 연구 중 하나이며, 대규모 언어 모델의 핵심이론인 트랜스포머 아키텍처에 대한 구글 리서치의 논문에 대해 살펴보겠습니다. 논문에서 제안한 트랜스포머 아키텍처는 모델이 입력의 특정 부분에 더 집중하도록 하는 어텐션 메커니즘(Attention Mechanism)을 다양하게 활용합니다. 이 블로그에서는 자연어 처리 모델의 핵심인 트랜스포머 아키텍처의 구조와 어텐션 메커니즘, 피드 포워드 신경망 등에 대해서 확인하실수 있습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문 제목: Attention Is All You Need 논문 저자: Google Research 논문게재.. 2024. 1. 14.
Ollama와 대규모 언어 모델 Llama2-uncensored를 활용한 PDF 요약과 음성변환 안녕하세요! 오늘은 대규모 언어 모델 활용도구인 Ollama를 활용해서 PDF의 내용을 요약하고 읽어주는 Llama2-unsensored(무검열) 모델을 만나보겠습니다. unsensored는 부적절한 내용이나 표현의 제한이 없는 모델을 가리킵니다. 예를 들면, "차를 어떻게 훔칠 수 있어?"라는 질문에 일반적인 언어 모델은 불법적이고 비윤리적인 정보를 제공할 수 없다고 응답하지만, 무검열 모델은 이러한 질문에도 제한 없이 답변할 수 있습니다. 이 블로그에서는 무검열 언어 모델을 이용한 텍스트 요약, PDF 파일처리 및 동적 페이지 범위설정, Text to Speech 라이브러리, gradio 웹 인터페이스 구축 등에 대해 알아보실 수 있습니다. 자, 같이 시작하실까요? "이 포스팅은 쿠팡 파트너스 활동의.. 2024. 1. 13.
Mixtral 대규모 언어 모델과 RAG을 활용한 위키피디아 검색 자동화 안녕하세요! 오늘은 대규모 언어 모델 Mixtral과 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 기술을 활용해서 위키피디아 검색을 자동화하는 프로젝트에 도전해 보겠습니다. 검색 자동화는 직접 사이트에서 검색하는 방식에 비해 검색 시간을 단축하고 효율을 향상시키며, 사용자 정의 가능성과 시스템 통합의 용이성 등 여러 가지 장점을 제공합니다. 이 블로그에서는 이전에 다룬 Haystack-AI를 활용한 위키피디아 데이터 수집, 인덱싱, 파이프라인 구성, 그리고 자연어 처리 기반 RAG 구축 방법 등에 대해 자세히 살펴보겠습니다. 이 프로젝트의 출처는 유튜브 "Zephyr Wikipeda Chatbot Brings Knowledge to Life" 이며, HuggingFa.. 2024. 1. 11.
Mixtral 8x7B 대규모 언어 모델로 온라인 의학 정보를 쉽게 확인해보세요. 안녕하세요! 오늘은 사용자의 요청이나 질문에서 키워드를 자동으로 추출해서 PubMed 의학정보 데이터베이스를 검색하고, 대규모 언어모델을 통해 응답하는 시스템을 만들어 보겠습니다. PubMed은 의학 및 생명과학 분야의 학술적 논문과 연구 결과를 수록한 미국 국립 의학 도서관(National Library of Medicine)에서 운영하는 무료 온라인 데이터베이스입니다. 이 블로그에서는 허깅페이스를 통한 대규모 언어 모델 활용방법과, Haystack-AI, pymed, PubMed 검색방법 등에 대해서 확인하실 수 있습니다. 그럼, 출발하실까요? 이 프로젝트의 출처는 유튜브 "Transform Healthcare with Mixtral: Create Your Own Chatbot Now" 입니다. "이.. 2024. 1. 10.
대규모 언어 모델을 활용한 고객리뷰 분석(feat. Solar, Mistral) 안녕하세요! 최근 자연어 처리(NLP)와 정보 검색 분야에서의 진화 속에서 대규모 언어 모델과 효율적인 데이터 저장기술이 만나면서 많은 발전이 이뤄지고 있는데요. 오늘은 대규모 언어 모델 Solar와 Mistral 7B를 이용해서 고객의 리뷰를 분석하고 인사이트를 도출해 보겠습니다. 이 블로그 포스트에서는 대규모 언어 모델의 이용을 편리하게 만들기 위한 Ollama, ChromaDB, Llama Index와 같은 AI도구의 활용방법에 대해 확인하실 수 있습니다. 자, 그럼 출발해 보실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 프로젝트 개요 이 프로젝트는 고객의 리뷰 1,000개가 저장되어 있는 CSV파일을 업로드한 후, 리뷰분석을 요청하면, Llam.. 2024. 1. 10.
Mobile ALOHA: 저렴한 전신 원격운전 양손 조작 학습 로봇 안녕하세요! 오늘은 저렴한 비용으로 전신(Whole-Body) 원격운전을 통해 인간의 복잡한 동작을 학습하여 스스로 양손 조작이 가능한 움직이는 로봇, Mobile ALOHA를 만나보겠습니다. 가사, 요리, 인간-로봇 상호작용 등 다양한 작업을 수행하는 Mobile ALOHA는 복잡한 동작도 학습을 통해 모방이 가능하며, 저렴한 하드웨어와 오픈소스 소프트웨어로 만들어졌습니다. 이 블로그를 통해 Mobile ALOHA의 설계 고려사항, 구성요소, 훈련방법, 수행작업, 실험결과, 향후전망에 대해서 확인하실 수 있습니다. 그럼 Mobile ALOHA를 만나러 가보실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문 제목: Mobile AL.. 2024. 1. 8.
텍스트 임베딩을 이용한 벡터검색 Q&A 시스템 만들기 안녕하세요! 오늘은 웹에서 사용자의 질문과 가장 유사한 Q&A 데이터셋을 벡터검색해서 유사도와 함께 표시하는 AI기반 Q&A 시스템을 만드는 프로젝트입니다. 기존의 키워드 검색방식은 만족하는 키워드가 없으면 검색결과가 전혀 안 나오지만, 벡터 검색방식은 질문의 내용과 의미상 가장 유사한 데이터를 검색해서 보여줍니다. 이 블로그에서는 허깅페이스의 Q&A 데이터셋 텍스트를 임베딩으로 변환하고, 주어진 쿼리와 유사한 임베딩을 가진 검색결과와 유사도를 표시하는 웹 페이지를 만들어 보겠습니다. 자, 같이 출발하실까요? 이번 프로젝트의 출처는 유튜브 "EASILY create Q&A Application using Embeddings with CUSTOM data" 입니다. "이 포스팅은 쿠팡 파트너스 활동의 일환.. 2024. 1. 7.
CrewAI를 이용한 대규모 언어 모델 Solar와 Hermes의 협업 프로젝트 안녕하세요! 오늘은 CrewAI라는 도구를 이용해서 국산 대규모 언어 모델 Solar와 Mistral 7B의 미세조정 모델인 Hermes의 협업 프로젝트를 만들어 보겠습니다. CrewAI는 인공 지능(AI) 에이전트에게 역할을 할당하고 목표를 공유하며 상호 작용하도록 조직화하는 데 사용되는 프레임워크입니다. 이 블로그에서는 Langchain과 Ollama를 통한 오픈소스 LLM 활용법과 CrewAI를 이용한 두 언어 모델의 협업 프로젝트에 대해 확인하실 수 있습니다. 자, 그럼 출발하실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." CrewAI? CrewAI는 깃허브에 공개되어 있는 프레임워크로, 공동의 목표를 위해 상호 작용하는 인공 지능(AI) 에이전.. 2024. 1. 7.
Mixtral-8x7B, MoE 언어 모델의 고속 추론 혁신 기술 안녕하세요! 오늘은 Mixture-of-Experts(MoE) 언어 모델을 고성능 GPU 없이도 빠르게 처리할 수 있는 새로운 기술에 대한 논문을 살펴보겠습니다. MoE는 각 분야에 특화된 서브네트워크(sub-network)를 의미하는 "전문가(Experts)"의 조합을 통해 입력 데이터를 처리하는 기술입니다. MoE 언어 모델 Mixtral-8x7B는 총 560억 개 파라미터를 가지며, Llama 2 70B 및 GPT3.5와 비교한 대부분의 벤치마크에서 매우 우수한 성능을 나타냅니다. 이 블로그를 통해서 제한된 GPU메모리 환경에서 MoE 언어 모델의 빠른 추론을 위한 혁신적인 기술들과 DEMO사이트에 대해서 살펴 보실수 있습니다. 2023.12.13 - [대규모 언어모델] - ChatGPT의 강력한 .. 2024. 1. 4.
제미나이 프로 비전과 이미지로 대화하는 웹 챗봇 만들기 안녕하세요! 오늘은 제미나이 프로 비전 API를 활용해서 이미지를 업로드하고 대화하는 웹 챗봇을 만들어 보겠습니다. 제미나이 프로 비전은 구글이 출시한 멀티모달 AI 모델이며, 이미지, 텍스트, 코드 등 다양한 형태의 정보를 처리하고 이해할 수 있습니다. 이 포스트를 통해서 Gradio와 Vertex AI를 사용하여 Gemini Pro Vision 모델과 상호 작용하기 위한 제미나이 프로 비전 API의 활용법과 이를 위한 구글 클라우드 설정방법 등에 대해서 확인하실 수 있습니다. 자, 출발해 볼까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 가상환경 만들기 먼저 아래 화면과 같이 아나콘다 파워쉘 프롬프트에서 "conda create -n name" 명령어.. 2024. 1. 1.
SOLAR 10.7B: 대규모 언어 모델의 효과적인 깊이 업스케일링 안녕하세요! 오늘은 국산 대규모 언어 모델 Solar 10.7B의 깊이(Depth) 업스케일링 기술에 대한 논문을 살펴보겠습니다. "깊이 업스케일링"은 대규모 언어 모델을 확장하기 위한 기술로, 주로 모델의 깊이(Depth)를 증가시키는 방법을 나타냅니다. 언어 모델의 깊이는 모델이 가지는 층(Layers)의 수를 의미하며, 이를 늘리는 것은 모델의 표현력과 성능을 향상시킬 수 있습니다. 이 블로그를 통해서 Solar 10.7B에 적용된 DUS(Depth Up-Scaling) 기술의 개요, 원리, 특성, 성능평가에 대해 확인하실 수 있습니다. 그럼, 출발하실까요? 논문 개요 및 목적 논문 제목: "SOLAR 10.7B: Scaling Large Language Models with Simple yet E.. 2023. 12. 31.
허깅페이스 1위 Solar 10.7B와 Autogen으로 대화하기 : feat. Mistral 7B 안녕하세요! 오늘은 허깅페이스의 오픈소스 LLM 리더보드에서 당당하게 1위를 차지하고 있는 우리나라 스타트업 "업스테이지"의 대규모 언어 모델 "Solar"와 대화를 해보겠습니다. 이번 프로젝트는 AutoGen이라는 프레임워크를 사용하여 Mistral 7B가 중계자 역할, Solar가 어시스턴트 역할을 담당해서 언어 모델 간에 서로 대화하며 자동화된 작업을 수행하도록 구현합니다. 여기서 다루게 될 대규모 언어 모델 관련 도구들은 다음과 같습니다. Autogen: LLM 애플리케이션을 개발하기 위한 프레임워크로서, 여러 에이전트들이 서로 대화하여 자동화된 작업을 해결할 수 있는 환경을 제공합니다. LiteLLM: 다양한 대규모 언어 모델을 손쉽게 활용할 수 있게 해주는 파이썬 라이브러리입니다. LM Stu.. 2023. 12. 30.
LiteLLM으로 Mistral 7B와 대화하는 웹 챗봇 만들기 안녕하세요! 오늘은 저번 시간 살펴본 제미나이 웹 챗봇에 이어서 Gradio 웹 인터페이스 2편으로 LiteLLM이라는 도구를 이용해서 허깅페이스의 인기 모델인 Mistral 7B와 대화하는 웹 챗봇 만들기에 도전해 보겠습니다. LiteLLM은 다양한 허깅페이스 모델을 손쉽게 활용할 수 있게 해주는 파이썬 라이브러리입니다. 이 블로그에서는 LiteLLM과 허깅페이스 API를 활용하여 Mistral 7B 웹 챗봇을 만드는 방법에 대해 살펴보겠습니다. 그럼 함께 시작하실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 가상환경 만들기 먼저 아나콘다 파워쉘 프롬프트에서 "conda create -n 가상환경 이름 python=3.11" 명령어로 새로운 가상환경을.. 2023. 12. 28.
제미나이 웹 챗봇 만들기 : 주식 정보 검색도 쌉가능 안녕하세요. 오늘은 구글의 대규모 언어 모델 제미나이와 웹에서 대화하는 Gradio 인터페이스 만들기에 도전해 보겠습니다. Gradio는 쉽게 웹 기반 사용자 인터페이스(UI)를 만들 수 있는 라이브러리로, 기계 학습 모델, 데이터 처리 파이프라인, 웹 애플리케이션 등을 빠르게 구축하고 공유할 수 있도록 지원합니다. 이 블로그에서는 제미나이 API와 Vertex AI, Gradio 라이브러리의 사용법에 대해서 확인하실 수 있습니다. 그럼 시작해 보실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 가상환경 만들기 먼저 가상환경을 새로 만들어야 하는데요. 아래 화면과 같이 아나콘다 파워쉘 프롬프트에서 "conda create -n 가상환경 이름" 명령어로 새.. 2023. 12. 26.
FERRET: 이미지에서 무엇이든 찾아서 표현하는 애플의 언어 모델 안녕하세요. 오늘은 애플이 2023년 10월에 발표한 "FERRET: REFER AND GROUND ANYTHING ANYWHERE AT ANY GRANULARITY"라는 논문에 대해 자세히 알아보겠습니다. 이 논문은 이미지 내에서 어떤 대상이든 어디서든 참조하고 위치를 지정하는 데 있어 매우 뛰어난 능력을 갖춘 Ferret 모델에 대한 것입니다. 이 블로그에서는 Ferret의 구조, 동작원리, 특징, 성능평가 등에 대해서 확인하실 수 있습니다. 논문개요 및 목적 논문 제목: FERRET: REFER AND GROUND ANYTHING ANYWHERE AT ANY GRANULARITY 논문 저자: Apple AI/ML 논문 게재 사이트: https://arxiv.org/abs/2310.07704v1 논문.. 2023. 12. 25.
VideoPoet: 구글의 제로샷(Zero-Shot) 비디오 생성 대규모 언어 모델 안녕하세요. 오늘은 구글이 개발한 대규모 언어모델 VideoPoet에 대한 논문을 살펴보겠습니다. VideoPoet은 구글 리서치에서 개발한 대규모 언어 모델로, 텍스트 입력을 통해 제로샷(Zero-Shot) 비디오 생성을 수행하는 능력을 갖춘 모델입니다. 이 블로그에서는 VideoPoet의 구조와 특징, 동작원리, DEMO 콘텐츠 등을 확인하실 수 있습니다. 그럼 출발하시죠~ "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문 제목 : "VideoPoet: A Large Language Model for Zero-Shot Video Generation" 논문 저자 : Google Research 논문 게재 사이트 : https://arxi.. 2023. 12. 23.
제미나이 API로 실시간 주식정보 가져오기 : 초보 탈출? 안녕하세요. 오늘은 구글 제미나이 API와 함수 호출기능을 활용해서 실시간 주식정보를 가져오는 프로젝트에 도전해 보겠습니다. 제미나이는 실시간 주식정보를 대답할 수 있는 기능이 없지만, yfinance와 같은 라이브러리를 사용하여 주식 가격을 얻은 후, 이 정보를 제미나이에 전달하여 모델이 해당 정보를 사용해 응답을 생성하도록 할 수 있습니다. 이 블로그에서는 제미나이 API와와 Google Cloud의 머신러닝 서비스 플랫폼 Vertex AI를 활용한 실시간 주식정보 함수 호출 및 응답처리 방법에 대해 확인하실 수 있습니다. 자, 그럼 같이 시작해 보실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 제미나이에게 실시간 주식정보 물어보기 구글의 대규모 언.. 2023. 12. 23.
[AI 논문 리뷰] 대규모 언어 모델을 위한 애플의 메모리 최적화 기술 안녕하세요. 오늘은 애플이 제한된 메모리 상에서 대규모 언어 모델 추론을 효과적으로 수행하는 혁신적인 기술을 제시한 논문에 대해 살펴보겠습니다. 이 논문은 윈도잉과 로우-칼럼 번들링이라는 새로운 개념을 소개합니다. 이 블로그에서는 이러한 기술이 어떻게 대규모 언어 모델의 실행을 혁신적으로 변화시키는지, 그리고 플래시 메모리를 활용하여 데이터 전송 및 메모리 사용을 어떻게 최적화하는지에 대해 알아보겠습니다. 그럼 시작해 볼까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문 제목: "LLM in a Flash: Efficient Large Language Model Inference with Limited Memory" 논문 저자: Ke.. 2023. 12. 22.
시각적 지시 조정 기술과 LLaVA 언어모델: 멀티모달 혁신의 최신 트렌드 안녕하세요. 오늘 살펴볼 AI 논문은 Visual Instruction Tuning (시각적 지시 조정) 기술과 이에 기반하여 개발된 LLaVA (Language-Image Visual Assistant)라는 멀티모달 언어모델에 대한 내용입니다. 시각적 지시 조정은 시각적인 콘텐츠에 대한 언어모델의 인지 정확도를 높이기 위한 기술이며, 논문에서는 이 기술을 기반으로 언어적 지시에 따라 시각적 작업을 수행하는데 특화된 LLaVA이라는 언어모델을 제시하고 있습니다. 이 블로그에서는 Visual Instruction Tuning 기술의 원리와 LLaVA 모델의 특징에 대해 알아보실 수 있습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문의 개요 및 목적 논.. 2023. 12. 20.
AI 논문 분석: 대규모 언어 모델을 활용한 프로그램 탐색, FunSearch 안녕하세요, 여러분! 오늘은 대규모 언어 모델을 활용한 프로그램 탐색에 대한 흥미로운 논문을 소개해드리려고 합니다. 이 논문은 Google DeepMind에서 발표한 논문으로, FunSearch라는 새로운 알고리즘을 소개하고 있습니다. FunSearch는 언어 모델을 기반으로 하는 발견적 프로그램 탐색 알고리즘으로, 어려운 수학적 문제에 대한 창의적이고 효과적인 해결책을 찾는 것을 목표로 합니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문제목: 수학적 발견: 대규모 언어 모델을 활용한 프로그램 탐색에서의 새로운 통찰(Mathematical discoveries from program search with large language .. 2023. 12. 19.
Ollama와 Langchain을 이용한 환각없는 RAG 챗봇 만들기 안녕하세요. 오늘은 저번시간에 다룬 Ollama와 대규모 언어모델 애플리케이션 개발 프레임워크인 Langchain을 이용해서 요즘 핫한 RAG(Retrieval-Augmented Generation, 검색 강화 생성) 모델을 만들어 보겠습니다. RAG는 외부 지식소스 검색을 통해 정보를 얻고, 이를 바탕으로 답변을 생성함으로써, 언어모델이 환각현상이나 부정확한 답변을 하지 않도록 보장하는 기술입니다. 이 블로그에서는 Ollama와 Langchain 사용방법, Chroma 데이터베이스 구축 및 RAG 구현방법에 대해 알아보실 수 있습니다. 그럼 같이 출발하실까요? 프로젝트 구성도 및 동작순서 이 프로젝트의 출처는 https://medium.aiplanet.com입니다. 이 프로젝트의 목표는 RAG 작업을 .. 2023. 12. 19.
초보도 할 수 있는 구글 제미나이로 AI 레시피 생성 웹페이지 만들기 안녕하세요. 오늘은 최근 공개된 제미나이 프로 비전의 API를 활용해서 레시피를 생성하는 웹페이지를 만드는데 도전해 보겠습니다. 이 블로그에서는 구글 AI 스튜디오에서 파이썬 코드를 가져와서, Flask로 앱을 만들고, 사용자가 사진을 입력하면 레시피가 표시되는 웹 페이지를 만드는 과정을 살펴보실 수 있습니다. 그럼 같이 시작해 볼까요? Google AI 스튜디오 API key 생성 Google AI 스튜디오는 생성 모델로 프로토타입을 제작하는 브라우저 기반 통합개발환경입니다. Google AI Studio를 사용하면 모델을 빠르게 사용하고 다양한 프롬프트로 실험할 수 있습니다 만족할 만한 내용을 빌드했다면 Gemini API를 기반으로 하는 원하는 프로그래밍 언어의 코드로 내보낼 수 있습니다. 먼저 G.. 2023. 12. 18.
Ollama를 활용한 대규모 언어 모델 웹 인터페이스 만들기: Mistral 7B와의 대화 안녕하세요. 오늘은 내 컴퓨터에서 웹 인터페이스로 최신 언어모델과 대화하는 프로젝트에 도전해 보겠습니다. 이 블로그에서는 Ollama라는 오픈소스 도구를 이용해서 최신 인기 대규모 언어모델 Mistral 7B와 대화할 수 있는 웹 인터페이스를 만드는 방법에 대해 확인하실 수 있습니다. 그럼 시작해 볼까요? Ollama란 무엇인가? Ollama(https://ollama.ai/)는 깃허브에서 2만 명 이상으로부터 별점을 받고 있는 인기 오픈소스로서 대규모 언어 모델을 웹 애플리케이션에서 손쉽게 활용할 수 있도록 도와주는 도구 중 하나입니다. Ollama는 로컬에서 실행되는 대규모 언어모델을 웹 앱에서 사용할 수 있도록 지원하며, 오픈소스 기반으로 웹 앱에서 다음과 같은 기능을 수행할 수 있습니다. 로컬 언.. 2023. 12. 15.
AI 분석 : 디에스단석 공모주 청약, 균등배정 몇주일까요? 안녕하세요. 오늘은 12월 14일과 15일 진행되는 올해 마지막 공모주 청약 기업인 디에스단석에 대해서 알아보겠습니다. 이 블로그에서는 바이오연료, 배터리/플라스틱 리사이클 사업을 하고 있는 디에스단석의 회사개요와 주력제품 경쟁력, 수요예측결과, 공모주 청약정보 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 회사개요 및 주력제품 경쟁력 디에스단석은 환경 친화적인 사업을 영위하고 있는 기업으로, 순환경제를 체계화하는 친환경 사업 분야에서 주력제품을 개발·생산하고 있습니다. 회사는 바이오디젤, 재생에너지, PVC안정제 등의 제품을 다양하게 생산하며, 이러한 제품군을 통해 지속 가능한 사업 모델을 유지하고 있습니다. 경쟁력은 기술적인 혁.. 2023. 12. 13.
ChatGPT의 강력한 경쟁 언어모델 등장!, Mixtral 8x7B 안녕하세요. 최근에 등장한 언어 모델 중에서 가장 주목받는 것 중 하나가 있습니다. 그것은 Mistral AI에서 선보이는 "Mixtral 8x7B"입니다. 이 모델은 혁신적인 Mixture-of-Experts(전문가의 혼합) 구조를 기반으로 하여 탁월한 성능을 자랑하며, 고성능과 효율성을 동시에 제공합니다. 이 블로그에서는 Mixtral 8x7B의 독특한 특징과 놀라운 성과에 대해 자세히 살펴보겠습니다. 함께 이 최신 언어모델의 세계로 들어가 보실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Mixtral 8x7B 언어모델이 무엇인가? Mixtral 8x7B 모델은 최신 기술의 Mixture of Experts(MoE) 기반 언어 모델로, 효율적이고 .. 2023. 12. 13.
AI 논문 분석 : 이미지 애니메이션의 혁신 라이브포토(LivePhoto) 안녕하세요! 이번에 함께 살펴볼 주제는 이미지 애니메이션의 혁신적인 방법에 관한 논문입니다. "LivePhoto"라는 프레임워크는 이미지에 텍스트 제어를 도입하여 어떤 동작을 그림으로 표현할 때 발생하는 문제점에 대한 창의적인 접근 방식을 제시합니다. 이 블로그에서는 논문에서 제시한 "LivePhoto"의 주요 연구 내용, 결과, 그리고 미래 전망을 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문제목: LivePhoto: 텍스트 제어 이미지 애니메이션을 위한 혁신적인 프레임워크(Real Image Animation with Text-guided Motion Control) 논문저자: Xi Chen, Zhiheng Liu .. 2023. 12. 12.
고성능 그래픽카드 없이도 실시간 이미지 생성 가능! KREA AI 안녕하세요. 최근 생성형 AI의 발전으로 기술과 예술의 구분이 점점 더 모호해지고 있습니다. 오늘 소개해드릴 KREA AI는 사용자 PC에 고성능 그래픽카드가 없어도 실시간으로 디지털 아트를 생성하고 상호 작용할 수 있는 생성형 AI입니다. 이 블로그에서는 KREA AI의 실시간 이미지 생성, 스크린 to 이미지, 업스케일과 AI 학습 기능 등에 대해서 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." KREA AI 개요 및 주요 기능 KREA AI는 사용자의 CPU나 GPU와 같은 컴퓨팅 자원을 사용하지 않고 서버에서 이미지 생성과 각종 변환 및 처리를 수행하는 웹 기반의 생성형 AI로서, 주요 기능은 다음과 같습니다. Real-Time Gene.. 2023. 12. 11.
728x90