본문 바로가기
반응형

전체 글234

시각적 지시 조정 기술과 LLaVA 언어모델: 멀티모달 혁신의 최신 트렌드 안녕하세요. 오늘 살펴볼 AI 논문은 Visual Instruction Tuning (시각적 지시 조정) 기술과 이에 기반하여 개발된 LLaVA (Language-Image Visual Assistant)라는 멀티모달 언어모델에 대한 내용입니다. 시각적 지시 조정은 시각적인 콘텐츠에 대한 언어모델의 인지 정확도를 높이기 위한 기술이며, 논문에서는 이 기술을 기반으로 언어적 지시에 따라 시각적 작업을 수행하는데 특화된 LLaVA이라는 언어모델을 제시하고 있습니다. 이 블로그에서는 Visual Instruction Tuning 기술의 원리와 LLaVA 모델의 특징에 대해 알아보실 수 있습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문의 개요 및 목적 논.. 2023. 12. 20.
AI 논문 분석: 대규모 언어 모델을 활용한 프로그램 탐색, FunSearch 안녕하세요, 여러분! 오늘은 대규모 언어 모델을 활용한 프로그램 탐색에 대한 흥미로운 논문을 소개해드리려고 합니다. 이 논문은 Google DeepMind에서 발표한 논문으로, FunSearch라는 새로운 알고리즘을 소개하고 있습니다. FunSearch는 언어 모델을 기반으로 하는 발견적 프로그램 탐색 알고리즘으로, 어려운 수학적 문제에 대한 창의적이고 효과적인 해결책을 찾는 것을 목표로 합니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문제목: 수학적 발견: 대규모 언어 모델을 활용한 프로그램 탐색에서의 새로운 통찰(Mathematical discoveries from program search with large language .. 2023. 12. 19.
Ollama와 Langchain을 이용한 환각없는 RAG 챗봇 만들기 안녕하세요. 오늘은 저번시간에 다룬 Ollama와 대규모 언어모델 애플리케이션 개발 프레임워크인 Langchain을 이용해서 요즘 핫한 RAG(Retrieval-Augmented Generation, 검색 강화 생성) 모델을 만들어 보겠습니다. RAG는 외부 지식소스 검색을 통해 정보를 얻고, 이를 바탕으로 답변을 생성함으로써, 언어모델이 환각현상이나 부정확한 답변을 하지 않도록 보장하는 기술입니다. 이 블로그에서는 Ollama와 Langchain 사용방법, Chroma 데이터베이스 구축 및 RAG 구현방법에 대해 알아보실 수 있습니다. 그럼 같이 출발하실까요? 프로젝트 구성도 및 동작순서 이 프로젝트의 출처는 https://medium.aiplanet.com입니다. 이 프로젝트의 목표는 RAG 작업을 .. 2023. 12. 19.
초보도 할 수 있는 구글 제미나이로 AI 레시피 생성 웹페이지 만들기 안녕하세요. 오늘은 최근 공개된 제미나이 프로 비전의 API를 활용해서 레시피를 생성하는 웹페이지를 만드는데 도전해 보겠습니다. 이 블로그에서는 구글 AI 스튜디오에서 파이썬 코드를 가져와서, Flask로 앱을 만들고, 사용자가 사진을 입력하면 레시피가 표시되는 웹 페이지를 만드는 과정을 살펴보실 수 있습니다. 그럼 같이 시작해 볼까요? Google AI 스튜디오 API key 생성 Google AI 스튜디오는 생성 모델로 프로토타입을 제작하는 브라우저 기반 통합개발환경입니다. Google AI Studio를 사용하면 모델을 빠르게 사용하고 다양한 프롬프트로 실험할 수 있습니다 만족할 만한 내용을 빌드했다면 Gemini API를 기반으로 하는 원하는 프로그래밍 언어의 코드로 내보낼 수 있습니다. 먼저 G.. 2023. 12. 18.
Ollama를 활용한 대규모 언어 모델 웹 인터페이스 만들기: Mistral 7B와의 대화 안녕하세요. 오늘은 내 컴퓨터에서 웹 인터페이스로 최신 언어모델과 대화하는 프로젝트에 도전해 보겠습니다. 이 블로그에서는 Ollama라는 오픈소스 도구를 이용해서 최신 인기 대규모 언어모델 Mistral 7B와 대화할 수 있는 웹 인터페이스를 만드는 방법에 대해 확인하실 수 있습니다. 그럼 시작해 볼까요? Ollama란 무엇인가? Ollama(https://ollama.ai/)는 깃허브에서 2만 명 이상으로부터 별점을 받고 있는 인기 오픈소스로서 대규모 언어 모델을 웹 애플리케이션에서 손쉽게 활용할 수 있도록 도와주는 도구 중 하나입니다. Ollama는 로컬에서 실행되는 대규모 언어모델을 웹 앱에서 사용할 수 있도록 지원하며, 오픈소스 기반으로 웹 앱에서 다음과 같은 기능을 수행할 수 있습니다. 로컬 언.. 2023. 12. 15.
AI 분석 : 디에스단석 공모주 청약, 균등배정 몇주일까요? 안녕하세요. 오늘은 12월 14일과 15일 진행되는 올해 마지막 공모주 청약 기업인 디에스단석에 대해서 알아보겠습니다. 이 블로그에서는 바이오연료, 배터리/플라스틱 리사이클 사업을 하고 있는 디에스단석의 회사개요와 주력제품 경쟁력, 수요예측결과, 공모주 청약정보 등에 대해서 알아보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 회사개요 및 주력제품 경쟁력 디에스단석은 환경 친화적인 사업을 영위하고 있는 기업으로, 순환경제를 체계화하는 친환경 사업 분야에서 주력제품을 개발·생산하고 있습니다. 회사는 바이오디젤, 재생에너지, PVC안정제 등의 제품을 다양하게 생산하며, 이러한 제품군을 통해 지속 가능한 사업 모델을 유지하고 있습니다. 경쟁력은 기술적인 혁.. 2023. 12. 13.
ChatGPT의 강력한 경쟁 언어모델 등장!, Mixtral 8x7B 안녕하세요. 최근에 등장한 언어 모델 중에서 가장 주목받는 것 중 하나가 있습니다. 그것은 Mistral AI에서 선보이는 "Mixtral 8x7B"입니다. 이 모델은 혁신적인 Mixture-of-Experts(전문가의 혼합) 구조를 기반으로 하여 탁월한 성능을 자랑하며, 고성능과 효율성을 동시에 제공합니다. 이 블로그에서는 Mixtral 8x7B의 독특한 특징과 놀라운 성과에 대해 자세히 살펴보겠습니다. 함께 이 최신 언어모델의 세계로 들어가 보실까요? "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." Mixtral 8x7B 언어모델이 무엇인가? Mixtral 8x7B 모델은 최신 기술의 Mixture of Experts(MoE) 기반 언어 모델로, 효율적이고 .. 2023. 12. 13.
AI 논문 분석 : 이미지 애니메이션의 혁신 라이브포토(LivePhoto) 안녕하세요! 이번에 함께 살펴볼 주제는 이미지 애니메이션의 혁신적인 방법에 관한 논문입니다. "LivePhoto"라는 프레임워크는 이미지에 텍스트 제어를 도입하여 어떤 동작을 그림으로 표현할 때 발생하는 문제점에 대한 창의적인 접근 방식을 제시합니다. 이 블로그에서는 논문에서 제시한 "LivePhoto"의 주요 연구 내용, 결과, 그리고 미래 전망을 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." 논문 개요 및 목적 논문제목: LivePhoto: 텍스트 제어 이미지 애니메이션을 위한 혁신적인 프레임워크(Real Image Animation with Text-guided Motion Control) 논문저자: Xi Chen, Zhiheng Liu .. 2023. 12. 12.
고성능 그래픽카드 없이도 실시간 이미지 생성 가능! KREA AI 안녕하세요. 최근 생성형 AI의 발전으로 기술과 예술의 구분이 점점 더 모호해지고 있습니다. 오늘 소개해드릴 KREA AI는 사용자 PC에 고성능 그래픽카드가 없어도 실시간으로 디지털 아트를 생성하고 상호 작용할 수 있는 생성형 AI입니다. 이 블로그에서는 KREA AI의 실시간 이미지 생성, 스크린 to 이미지, 업스케일과 AI 학습 기능 등에 대해서 살펴보겠습니다. "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다." KREA AI 개요 및 주요 기능 KREA AI는 사용자의 CPU나 GPU와 같은 컴퓨팅 자원을 사용하지 않고 서버에서 이미지 생성과 각종 변환 및 처리를 수행하는 웹 기반의 생성형 AI로서, 주요 기능은 다음과 같습니다. Real-Time Gene.. 2023. 12. 11.
GPT-4가 규제 대상? 유럽연합 AI 규제법의 핵심 내용 안녕하세요, 최근 유럽연합 AI 규제법의 합의가 발표되면서 AI 기술의 발전과 동시에 기술 책임과 규제에 대한 필요성이 강조되고 있습니다. 이 글에서는 유럽연합을 중심으로 하는 AI 규제법, 미국과 중국의 규제 동향, 그리고 GPT-4와 같은 대형 언어 모델의 AI 규제 이슈에 대해 살펴보겠습니다. 그럼 시작해 볼까요? 변화의 바람, EU AI 법의 도래 유럽연합(EU)이 12월 8일(현지시간) 마침내 'AI Act'라 불리는 인공지능(AI) 규제법에 합의하면서, 글로벌한 AI 산업에 대한 새로운 변화의 바람이 불고 있습니다. 이 법의 합의는 유럽 내에서 AI 기술의 적용과 활용에 대한 체계를 정립하는 새로운 기준을 제시하며, 오픈 AI의 최신 모델 'GPT-4'가 이 규제의 핵심 대상으로 언급되면서 산.. 2023. 12. 10.
Fooocus: 이미지 생성의 새로운 차원을 여는 AI 아트 소프트웨어! 안녕하세요. 오늘은 텍스트 to 이미지 AI 중 간단한 프롬프트만으로 고품질의 이미지를 만들 수 있는 Fooocus라는 생성형 AI를 소개해 드리려고 합니다. Fooocus는 복잡한 프롬프트, 파라미터 설정, 워크플로우 작성과 같은 어려움 없이 누구나 간단한 프롬프트 만으로도 충분히 멋진 이미지를 만들 수 있습니다. 이 블로그에서는 Fooocus의 인/아웃페인팅, 업스케일, 베리에이션, 스타일, 이미지 프롬프트 기능에 대해 알아보겠습니다. Fooocus 설치방법 Fooocus는 강력한 이미지 생성 기능을 제공하는 AI 아트 소프트웨어로, 설치 방법은 간편하게 진행됩니다. 다음은 Fooocus를 설치하는 단계입니다. 다운로드 및 압축해제 : GitHub 레포지토리에서 Fooocus를 다운로드합니다. [Fo.. 2023. 12. 9.
제미나이(Gemini) 멀티모달리티 테스트 결과 안녕하세요. 구글에서 공개한 새로운 차세대 대규모 언어모델 제미나이에 대한 관심이 모아지고 있습니다. 오늘은 제미나이 프로가 적용된 구글 바드를 이용해서 제미나이의 기능을 알아보겠습니다. 이 블로그에서는 제미나이의 이미지와 동영상 인식기능, 코드인식 및 분석기능 등 멀티모달리티 기능 일부에 대한 테스트 결과를 확인하실 수 있습니다. 이미지 분석 먼저 이미지를 분석해 보겠습니다. 아래 화면의 왼쪽과 같이 어느 이동통신 회사의 데이터를 회귀분석하는 문제를 사진으로 찍어서 바드에게 요청하였습니다. 바드는 회귀분석을 통해 표와 그래프를 표시하고, 독립변수가 종속변수에 미치는 영향을 분석해서 나름의 분석결과를 표시하였습니다. 하지만 바드는 데이터를 정확하게 읽지 못하고 환각현상(Hallucination)을 일으킨.. 2023. 12. 8.
AI 뉴스 리뷰 : 구글, 최신 AI모델 Gemini 공개 안녕하세요. 구글이 어제(12월 6일) 최첨단 대규모 언어 모델(LLM) 제미나이(Gemini)를 출시했는데요. 내년에 발표될 것이라는 예상과 달리 갑자기 발표해서 모두를 놀라게 했습니다. 이 블로그에서는 Gemini의 멀티모달리티를 포함한 주요 기능과 특징, 그리고 Gemini Pro가 적용된 구글 바드(Bard)에 대해 살펴보실 수 있습니다. Gemini 주요 기능 및 특징 Gemini는 멀티모달리티(Multimodality)를 기반으로 한 구글의 차세대 인공지능 언어모델입니다. 멀티모달리티는 텍스트뿐만 아니라, 이미지, 오디오, 비디오와 같은 다양한 형태의 입력정보를 인식하고 처리하여, 소통할 수 있는 능력입니다. 구글 Gemini의 주요 기능과 특징은 다음과 같습니다. 멀티모달리티: 텍스트, 이미.. 2023. 12. 7.
AI 단신 : '챗봇이 파일 하나', 'MS의 말하는 아바타 생성기술' 안녕하세요. AI분야의 최신 소식을 핵심만 요약해서 전해드리는 AI 단신 카테고리를 새로 만들었습니다. 오늘은 그 첫 시간으로 두 가지 소식을 준비했는데요. 파이어폭스로 잘 알려진 모질라(Mozilla)의 대규모 언어모델(Large Language Model) llamafile과 마이크로소프트의 최신 Image to Video 기술에 대한 소식입니다. 파일 하나가 챗봇? 첫 번째 소식은 오픈 소스 소프트웨어 개발과 웹 기술 분야에서 활동하는 비영리 기업인 모질라(Mozilla)에서 2023년 12월 3일(현지시간), 대규모 언어 모델(LLM)을 단일 실행 파일 형태로 배포하여 PC에서 간편하게 활용할 수 있는 '라마파일(llamafile)'을 공개하였다는 소식입니다. 라마파일은 LLM의 학습상태를 나타내.. 2023. 12. 6.
새로워진 구글 바드의 Extension과 추가기능을 사용해보세요. 안녕하세요. 오늘은 구글의 대형언어모델인 바드(Bard)의 업데이트 소식입니다. 이번 업데이트로 바드는 유튜브 요약, 인터넷 실시간 검색, 이메일 검색, 뉴스 요약, 사진 속 데이터 추출, 답변 방식 조정 등 여러 가지 Extension이 추가되었습니다. 바드가 ChatGPT를 따라잡을 수 있을지 관심이 모아지고 있습니다. 그럼 새로워진 바드를 만나러 가실까요? 새로운 기능, Extension 이번 업데이트에서 가장 큰 변화는 Extension(확장기능)의 추가입니다. 아래 화면에서 보시는 것과 같이 구글 호텔, 구글 지도, 구글 항공, 구글 워크스페이스, 유튜브까지 현재 5가지의 확장기능이 추가되었습니다. 이 확장기능을 사용하면 바드가 지메일, 구글 문서, 구글 드라이브, 구글 지도, 유튜브, 구글 항.. 2023. 12. 6.
AI 논문 분석 : 캐릭터 이미지 한 장으로 애니메이션 만들기, Animate Anyone 안녕하세요. 오늘은 캐릭터의 이미지 한 장만 있으면 원하는 자세로 움직이는 애니메이션 만들 수 있는 Animate Anyone이라는 기술을 발표한 논문에 대해 살펴보겠습니다. 이번 블로그에서는 이미지로부터 일관되고 안정적인 캐릭터 애니메이션을 구현하기 위해 개발된 Animate Anyone 기술의 원리와 구조, 특징 등에 대해서 확인하실 수 있습니다. 논문 개요 및 목적 이 논문의 개요와 목적은 다음과 같습니다. 논문 제목 : Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation 논문 저자 : Li Hu, Xin Gao, Peng Zhang, Ke Sun, Bang Zhang, Liefeng .. 2023. 12. 5.
Stable Diffusion과 ComfyUI로 AI 사진작가에 도전하세요 안녕하세요. 오늘은 생성형 AI를 활용해서 사진작가에 도전해 보겠습니다. 활용도구는 노드 기반의 인터페이스로 코드를 작성하지 않고도 Stable Diffusion을 사용할 수 있는 ComfyUI, 빠른 이미지 생성이 가능한 Stable Diffusion LCM입니다. 이 블로그에서는 ComfyUI를 이용한 Stable Diffusion LCM의 활용방법에 대해 살펴보실 수 있습니다. 1단계 ComfyUI 설치하기 ComfyUI는 Stable Diffusion을 위한 노드 기반의 GUI(Graphical User Interface, 그래픽 사용자 인터페이스)입니다. ComfyUI를 사용하면 코드를 작성하지 않고도 Stable Diffusion을 사용하여 이미지를 생성할 수 있으며, 다양한 노드가 제공되고,.. 2023. 12. 4.
AI 분석 : 블루엠텍 공모주 청약 어떤가요? 안녕하세요. 오늘은 의약품 유통 전문기업 블루엠텍의 공모주 청약에 대해서 분석해 보겠습니다. 이 블로그의 분석자료는 ChatGPT, 구글 바드에게 증권신고서, 투자설명서, 회사 홈페이지 자료 등을 학습시켜 작성하였습니다. 의약품 유통계의 쿠팡이라고 불리는 블루엠텍이 어떤 회사인지 만나러 가보실까요? 회사개요 및 주력제품 경쟁력 블루엠텍은 27,000여 곳 이상의 병의원 회원과 제약사를 대상으로 의약품 및 의약외품 등의 판매, 상품의 중개업을 영위하고 있으며, 플랫폼 내 광고 및 마케팅, IT서비스를 제공하거나 중개하고 있습니다. 블루엠텍의 주력제품은 온라인 의약품 유통 플랫폼인 "블루팜코리아"입니다. 블루팜코리아는 병의원과 제약사가 의약품을 효율적으로 구매하고 판매할 수 있도록 지원하는 플랫폼입니다. 블.. 2023. 12. 2.
AI 논문 요약, '유망 신소재' 38만개 찾은 딥마인드의 AI기술 안녕하세요. 오늘은 AI분야 최신 논문을 요약해서 알아보는 여섯 번째 시간입니다. 최근 구글 딥마인드가 AI로 유망 신소재 38만 개를 찾았다는 기사와 논문이 발표되었는데요. 딥마인드가 신소재를 찾은 AI기술이 어떤 것인지 알아보겠습니다. 블로그 내용은 ChatGPT에 해당 논문 pdf를 입력해서 요약 및 해석한 결과를 바탕으로 작성하였습니다. 2023. 12. 1.
AI 분석 : LS머트리얼즈 공모주 청약할까? 안녕하세요. 오늘은 12월 1일, 4일 진행되는 LS머트리얼즈의 공모주 청약에 대해 알아보겠습니다. 이 블로그의 내용은 구글 바드와 클라우드 AI에게 증권신고서, 투자설명서, 홈페이지 자료 등을 학습시켜 작성하였습니다. 회사 개요 및 주요 제품 경쟁력 LS머트리얼즈는 중대형 울트라커패시터(Ultra Capacitor)를 전문으로 생산하는 회사입니다. 울트라커패시터는 전기자동차, 풍력발전, 산업용 로봇, UPS 등 다양한 분야에서 활용되는 에너지 저장장치입니다. LS머트리얼즈의 주요 제품은 크게 셀과 모듈로 나뉩니다. 셀은 울트라커패시터의 기본 단위로, 용량과 전압에 따라 다양한 종류가 있습니다. LS머트리얼즈는 2.8V 600F, 3.0V 3400F, 3.0V 4000F 등의 고용량, 고전압 셀을 생산하.. 2023. 11. 30.
누구나 쉽게 할수있는 AI 인플루언서 만들기 안녕하세요. 오늘은 몇 가지 AI도구를 활용해서 AI 인플루언서의 인스타그램 릴을 만드는데 도전해 볼 건데요. 이 블로그에서는 1단계 Seaart 이용한 인플루언서 이미지 만들기, 2단계 Canva를 이용한 인스타그램 릴 만들기, 3단계 Pinokio 브라우저의 Facefusion을 이용한 얼굴 바꾸기의 순서로 만들어보겠습니다. 그럼 인플루언서를 만나러 가보실까요? 1단계 인플루언서 이미지 만들기 먼저 인플루언서의 기본 이미지를 만들기 위해 텍스트 to 이미지 AI Seaart.ai에 접속합니다. SeaArt.ai는 텍스트와 이미지를 결합하여 다양한 종류의 창의적인 콘텐츠를 생성하는 인공지능입니다. SeaArt.ai는 OpenAI의 Stable Diffusion XL 모델을 기반으로 개발되었으며, 다음과.. 2023. 11. 29.
AI 논문 분석 : 범용인공지능(AGI)의 정의와 수준, 그리고 미래 안녕하세요. 오늘은 AI관련 논문을 분석해 보는 다섯 번째 시간으로, 구글 딥마인드에서 최근 발표한 AGI(Artificial General Intelligence, 범용인공지능)의 정의를 고찰하고 달성 수준의 구분단계를 제시한 논문을 살펴보겠습니다. 논문 분석은 PrivateGPT, ChatGPT, 구글 바드 등을 활용해서 내용을 파악하고, 요약, 정리하였습니다. 논문의 개요 및 목적 이 논문의 개요는 다음과 같습니다. 논문 제목 : Levels of AGI: Operationalizing Progress on the Path to AGI. 논문 저자 : Meredith Ringel Morris1 외 Google DeepMind 논문 게재 사이트 : arXiv 논문 게재일 : 2023. 11 이 논문은.. 2023. 11. 28.
PrivateGPT 윈도우11 설치 가이드 : 내 컴퓨터에 문서AI가? 안녕하세요. 오늘은 pdf나 hwp와 같은 문서를 챗봇에 입력하고 문서에 대해 대화할 수 있는 PrivateGPT(개인용 GPT)를 설치하는 과정에 대해 알아보겠습니다. 이 블로그는 윈도우11 운영체제를 기준으로 1단계 Conda 설치하기, 2단계 레파지토리 복사하기, 3단계 Poetry 설치하기, 4단계 개인용 GPT 실행하기 순서로 작성하였습니다. 1단계 Conda 설치하기 먼저 Conda라는 Python 패키지 관리자 및 가상 환경 관리자를 컴퓨터에 설치해야하는 데요. Python 패키지 관리자는 Python 패키지를 설치, 업데이트, 제거하는 데 사용되는 도구입니다. 가상 환경 관리자는 Python 애플리케이션을 별도의 환경에서 실행할 수 있도록 하는 도구입니다. Conda는 다음과 같은 기능을 .. 2023. 11. 28.
AI 분석 : 케이엔에스 공모주 청약 안녕하세요. 오늘은 11월 27일, 28일 진행되는 2차 전지 자동화 설비 전문업체 케이엔에스의 공모주 청약에 대해서 알아보겠습니다. 이 블로그의 내용은 구글바드 AI, GPT4기반 대규모 언어모델에 투자설명서, 증권신고서, 회사 홈페이지 자료 등을 학습시켜서 작성하였습니다. 회사 개요 및 주력제품 경쟁력 케이엔에스는 2006년 설립된 2차 전지 자동화 설비 전문업체입니다. 주력 제품은 원통형 CID(전류차단장치) 장비와 BMA(배터리 모듈 어셈블리) 자동화 장비입니다. 원통형 CID 장비는 배터리 내부의 과열 및 압력을 감지해 배터리 열 폭주 전의 현상을 사전에 차단하는 용도로 사용됩니다. 케이엔에스의 원통형 CID 장비는 경쟁사 대비 설비의 간소화 및 공정간 제품 이동 자동화 등을 통해 품질 향상 및.. 2023. 11. 26.
무료로 혼자 사용하는 GPT4 AI 챗봇 만들기!! 안녕하세요. 최근 이슈가 되고있는 오픈 AI의 GPT4 언어모델은 ChatGPT 플러스 사용자에게 월 20달러로 제공되는 유료 서비스입니다. 오늘은 GPT4뿐만 아니라 다양한 대규모 언어모델을 무료로 사용할 수 있는 방법을 소개해드리려고 하는데요. 최신 대규모 언어모델을 내컴퓨터에 설치해서 나만의 AI 챗봇을 무료로 만드는 방법에 대해서 알아보겠습니다. 1단계 웹 UI 설치하기 먼저 채팅을 할수 있는 웹 UI를 설치하기위해 깃허브 레파지토리(https://github.com/oobabooga/text-generation-webui)에 접속합니다. 화면에 있는 53개의 파일들을 깃허브 데스크톱( https://desktop.github.com/)을 설치해서 복사하거나 아래 왼쪽 화면에 보이는 녹색버튼 Co.. 2023. 11. 26.
AI 도구로 영화 아바타 예고편 만들기, 5단계 완성 과정 안녕하세요. 인공지능 기술의 발전과 함께 과거에는 영화 예고편을 만들기 위해서는 전문적인 영상 편집 기술과 장비가 필요했지만, 이제는 인공지능을 활용하면 누구나 쉽게 영화 예고편을 만들 수 있습니다. 이번 블로그에서는 인공지능을 활용하여 영화 예고편을 만드는 과정을 5단계로 나누어 소개해 드리겠습니다. 1단계 내레이션 대본 만들기 첫 번째 단계는 내레이션 대본을 만드는 것입니다. 내레이션 대본은 영화의 내용과 분위기를 간결하고 효과적으로 전달할 수 있도록 작성해야 합니다. 내레이션 대본을 작성할 때는 다음과 같은 사항을 고려해야 합니다. 영화의 주요 내용을 포함해야 합니다. 영화의 분위기를 잘 전달해야 합니다. 시청자의 관심을 끌 수 있어야 합니다. 저는 Perplexity AI를 활용해서 내레이션 대본.. 2023. 11. 24.
AI 분석 : 와이바이오로직스 공모주 청약 경쟁률 어떨까? 안녕하세요. 오늘은 11월23일과 24일 진행되는 와이바이오로직스의 공모주 청약에 대해 알아보겠습니다. 와이바이오로직스는 항체신약 연구·개발 기업으로 면역항암제 및 다양한 항체신약을 개발하는 기업입니다. 증권신고서, 투자설명서, 홈페이지 자료 등을 구글 바드, 코파일럿, 클라우드 등 몇 가지 대규모언어모델에 학습시켜서 작성하였으며, 이 블로그를 통해 와이바이오로직스의 기술경쟁력, 재무건전성, 수요예측 결과 및 공모주 청약정보를 확인하실 수 있습니다. 회사개요 및 사업모델 와이바이오로직스는 2007년 설립되었으며, 항체신약 플랫폼기술을 기반으로 면역항암제 및 다양한 항체신약을 개발하고 있는 기업으로서 주요 목적사업은 다음과 같습니다. 구분 목적사업 영위하고 있는 사업 바이오신약 연구개발 바이오신약 연구개발.. 2023. 11. 23.
AI 논문 분석 : LRM, 5초 안에 단일 이미지에서 3D로 안녕하세요. 오늘은 AI 분야 최신 논문을 살펴보는 네 번째 시간입니다. 요즘 생성형 AI 기술의 발전이 매우 빠른 것 같은데요. 저번 시간에 다룬 실시간 수준 스테이블 디퓨전 이미지 생성에 이어서 이번 시간에는 5초 만에 단일 이미지를 3D 이미지로 만드는 LRM(Large Reconstruction Model, 대규모 재구성 모델)이라는 기술에 대해 알아보겠습니다. 논문의 개요 이 논문의 개요는 다음과 같습니다. 논문 제목 : LRM: LARGE RECONSTRUCTION MODEL FOR SINGLE IMAGE TO 3D 논문 저자 : Yicong Hong, Kai Zhang 외 논문 게재 사이트 : arXiv 논문 게재일 : 2023. 11 논문의 목적과 연구방식은 다음과 같습니다. 약 100만개.. 2023. 11. 21.
AI 분석 : 에이텀 공모주 청약해도 될까요? 안녕하세요. 오늘은 트랜스 제조회사인 에이텀의 공모주 청약에 대해 알아보겠습니다. 에이텀의 증권신고서, 투자설명서, 홈페이지 자료 등을 클로드 AI와 빙 AI에게 학습시켜서 작성하였으며, 이 블로그를 통해 에이텀의 기술력, 재무건전성, 수요예측 결과 및 공모주 청약정보를 확인하실 수 있습니다. 회사 개요 및 주력제품 에이텀은 2016년에 설립된 트랜스(Transformers, 변압기) 제품을 전문으로 생산하는 기업입니다. 회사는 현재 휴대용 충전기와 TV용 트랜스 시장에서 입지를 다져오고 있으며, 2024년 전기자동차(EV) 시장으로 진출을 위해 준비하고 있습니다. 사업영역 부문 주요 제품 생산(판매) 개시연도 트랜스 (제조업) 휴대용 전자기기 충전기 부문 현재:15W, 25W, 45W 향후:65W,14.. 2023. 11. 20.
AI 논문분석 : 실시간 Stable Diffusion 이미지 생성! 체험해보세요 안녕하세요. 오늘은 AI관련 최신 논문을 분석해 보는 세 번째 시간입니다. 다양한 텍스트 to 이미지 AI 도구 중에서 많은 사용자를 확보하고 있는 Stable Diffusion은 이미지의 품질이 우수하지만 생성속도가 느린 것이 단점이었는데요. 최근 생성속도를 획기적으로 개선한 모델이 나왔다는 소식입니다 그 모델은 바로 Latent Consistency Model(이하 LCM)이라는 모델입니다. 이 블로그에서는 LCM이 어떤 기술인지 살펴보고, 어느 정도 빠른 속도인지 직접 체험해 보실 수 있습니다. 논문의 개요 이 논문의 개요는 다음과 같습니다. 논문 제목 : LCM-LORA: A UNIVERSAL STABLE-DIFFUSION ACCELERATION MODULE 논문 저자 : Simian Luo, Y.. 2023. 11. 18.
반응형