안녕하세요! 오늘은 Black Forest Labs에서 발표한 최신 이미지 생성 모델인 Flux 1.1 Pro에 대해 알아보겠습니다. Flux 1.1 Pro는 이전 버전인 Flux 1.0 Pro보다 6배 더 빠른 속도를 자랑하며, 이미지 품질, 프롬프트 준수, 그리고 다양한 스타일과 장면을 처리하는 능력이 크게 향상되었습니다. 특히 이번에는 BFL API와 통합되어, 개발자와 기업들이 Flux의 뛰어난 기능을 애플리케이션에 쉽게 적용할 수 있습니다. 이 블로그에서는 Flux 1.1 Pro의 개요, 주요 특징 및 기능, 그리고 사용방법 등에 대해 살펴보겠습니다.
"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
Flux 1.1 Pro 개요 및 특징
Flux 1.1 Pro는 Black Forest Labs에서 개발한 최첨단 오픈 가중치 이미지 생성 모델입니다. 이 모델은 이전 버전인 Flux 1.0 Pro보다 6배 빠른 생성 속도를 자랑하며 이미지 품질, 프롬프트 준수 및 전반적인 다양성 측면에서도 향상된 성능을 제공합니다. Flux 모델 제품군은 이미지 세부 정보, 프롬프트 준수, 스타일 다양성 및 텍스트-이미지 합성을 위한 장면 복잡성 측면에서 새로운 최첨단 기술을 정의하는 오픈 가중치 텍스트-이미지 모델 제품군입니다.
Flux 1.1 Pro는 2024년 10월 2일에 Black Forest Labs에서 발표한 두 가지 주요 제품 중 하나입니다. 다른 하나는 개발자와 기업이 FLUX의 이미지 생성 기능을 자체 애플리케이션에 통합할 수 있도록 하는 API인 BFL API입니다. Flux 1.1 Pro는 이전 모델에 비해 속도, 성능, 사용자 정의 및 확장성 측면에서 다음과 같은 여러 가지 주요 개선 사항을 제공합니다.
- 속도 및 효율성 향상: Flux 1.1 Pro의 가장 눈에 띄는 특징은 빠른 생성 속도입니다. Flux 1.1 Pro는 이전 버전인 Flux 1.0 Pro보다 6배 빠르며 현재 사용 가능한 업데이트된 버전의 Flux 1.0 Pro보다 3배 빠릅니다. 또한 Black Forest Labs는 Flux 1.0 Pro 모델을 업데이트하여 이전과 동일한 출력을 생성하지만 두 배 빠른 속도를 제공합니다. 이러한 속도 향상은 더 효율적인 워크플로우를 가능하게 하고 이미지 생성 작업의 생산성을 크게 향상시킵니다.
- 향상된 성능: Flux 1.1 Pro는 이미지 품질, 프롬프트 준수 및 출력 다양성 측면에서도 개선되었습니다. 텍스트-이미지 모델의 벤치마크인 Artificial Analysis 이미지 분야에서 "블루베리"라는 코드명으로 테스트된 Flux 1.1 Pro는 리더보드의 다른 모든 모델을 능가하여 가장 높은 전체 Elo 점수를 달성했습니다.
- 고급 사용자 정의: Flux 1.1 Pro는 BFL API를 통해 제공되며 모델 선택, 이미지 해상도 및 콘텐츠 조정에 대한 사용자 지정 옵션을 제공하여 특정 요구 사항에 맞게 API 출력을 조정할 수 있습니다. 이러한 수준의 사용자 정의를 통해 사용자는 이미지 생성 프로세스를 세밀하게 제어하여 특정 요구 사항을 충족하는 결과물을 얻을 수 있습니다.
import os
import requests
request = requests.post(
'https://api.bfl.ml/v1/flux-pro-1.1',
headers={
'accept': 'application/json',
'x-key': os.environ.get("BFL_API_KEY"),
'Content-Type': 'application/json',
},
json={
'prompt': 'A cat on its back legs running like a human is holding a big silver fish with its arms. The cat is running away from the shop owner and has a panicked look on his face. The scene is situated in a crowded market.',
'width': 1024,
'height': 768,
},
).json()
print(request)
request_id = request["id"]
- 확장성: BFL API는 소규모 프로젝트에서 엔터프라이즈급 애플리케이션에 이르기까지 애플리케이션을 원활하게 확장할 수 있도록 설계되었습니다. 이러한 확장성은 Flux 1.1 Pro를 다양한 사용 사례에 적합하게 만들어 소규모 기업과 대기업 모두에게 적합한 솔루션입니다.
- 경쟁력 있는 가격: BFL API는 저렴한 비용으로 뛰어난 이미지 품질을 제공합니다. Flux 1.0 Dev의 가격은 이미지당 2.5센트, Flux 1.0 Pro는 이미지당 5센트, Flux 1.1 Pro는 이미지당 4센트입니다. 이러한 경쟁력 있는 가격은 Replicate 또는 Together AI와 같은 공급자로부터 전환하려는 사람들에게 매력적인 옵션입니다.
Flux 1.1 Pro 테스트
Flux 1.1 Pro는 API 액세스 권한이 있는 Together.ai, Replicate, Fal.ai, Freepik를 포함한 여러 플랫폼에서 사용할 수 있습니다. Black Forest Labs는 또한 고유한 API 액세스 권한을 제공합니다. 여기서는 Together.ai의 플레이그라운드에 접속해서 테스트 이미지를 생성해 보겠습니다.
https://api.together.xyz/playground/image/black-forest-labs/FLUX.1.1-pro
테스트는 이전에 포스트 한 Flux .1 dev 모델에 사용했던 프롬프트와 동일한 프롬프트를 입력하고 두 이미지를 비교하였습니다. Flux .1 dev 모델에 대한 포스팅은 아래 링크를 참고하세요.
2024.08.04 - [AI 언어 모델] - 🚀최고의 이미지 생성 모델! Flux.1: GPU 스트레스 없는 API 방식 가이드
텍스트 프롬프트 1: Create a serene woman practicing yoga on a beach at sunrise, with long, wavy hair and a peaceful expression, as ocean waves gently lap at her feet.
텍스트 프롬프트 2: Create a high-resolution image of a young woman with long hair, wearing an ornate golden crown. The woman is looking directly at the camera with a serious expression. She is holding up both hands in front of her, with each hand displaying a peace sign. The background is artistically textured with shades of teal and gold, adding a regal and dramatic effect to the scene. The lighting should be soft but dramatic, emphasizing the details of the crown and the woman's facial features.
텍스트 프롬프트 3: A girl is standing on the beach wearing sun glasses.
텍스트 프롬프트 4: A woman is showing her hands with fingers spread.
텍스트 프롬프트 5: A beautiful woman holding a sign that says "This is an example of long text to test Flux 1.1 Pro" with bold text
텍스트 프롬프트 6: Create a high-resolution image of a modern kitchen with wooden cabinets and stainless steel appliances, featuring a clear glass bottle on a wooden table that contains a vibrant galaxy with swirling nebulae and stars.
텍스트 프롬프트 7: black forest gateau cake spelling out the words "FLUX 1.1 Pro", tasty, food photography, dynamic shot
참고 이미지
다음 테스트 이미지는 20081120_ yearbook_photo.jpg(좌)과 20081120_passport_photo.jpg(우) 과 같이 임의의 파일명으로 프롬프트를 입력한 결과입니다. Flux 1.1 Pro는 이와 같이 파일명을 입력하면 관련된 이미지를 생성해 줍니다.
아래 이미지들은 Flux 1.1 Pro 모델의 다양한 프롬프트 충실도를 테스트한 이미지들입니다.
테스트 결과, Flux 1.1 Pro의 이미지 생성 속도는 1장에 약 5~6초 정도 소요되어 눈에 띄게 빨라졌습니다. 전반적인 프롬프트 충실도가 매우 우수하며, "지루한 스냅챗 사진" 프롬프트를 사용하여 생성한 이미지는 실제 핸드폰으로 촬영한 이미지로 착각할 정도로 사실적인 느낌을 줍니다.
Flux 1.1 Pro 이미지 생성기 만들기
다음은 Together API를 이용해서 Flux 1.1 Pro 이미지 생성기를 만들어 보겠습니다. 작업환경은
Windows 11 Pro, WSL2, 파이썬 3.11, Cursor 0.41.3이며, "WSL 연결"을 통해 Windows Subsystem for Linux(WSL) 환경에 액세스 하도록 구성하였습니다.
1. API Key 발급: 먼저 다음 사이트에 접속해서 가입한 후, API Key를 발급합니다.
https://api.together.xyz/settings/api-keys
2. 의존성 패키지 설치 및 API Key 설정: 다음은 가상환경을 생성한 후, 가상환경이 활성화된 상태에서 의존성 패키지를 설치하고, API Key를 설정합니다.
python3.11 -m venv myenv
source myenv/bin/activate
pip install gradio together
export TOGETHER_API_KEY=발급받은 API Key
3. 코드 작성: 아래 코드를 복사해서 app.py 이름으로 저장합니다. 코드는 사용자 입력 프롬프트를 기반으로 Flux 1.1 Pro 모델의 이미지를 생성하는 기능을 하며, 동작순서는 다음과 같습니다.
- 라이브러리 임포트: 필요한 라이브러리들을 가져와서 코드에서 사용할 수 있도록 준비합니다.
- API 클라이언트 초기화: 환경 변수에서 API 키를 가져와 Together 클라이언트를 초기화합니다.
- 이미지 생성 함수 정의: 사용자가 입력한 프롬프트를 기반으로 이미지를 생성하는 함수를 정의합니다.
- Gradio 인터페이스 설정: Gradio를 사용하여 웹 인터페이스를 설정하고, 입력 및 출력 형식을 지정합니다.
- 인터페이스 실행: launch() 메서드를 호출하여 Gradio 인터페이스를 실행하고, 사용자가 접근할 수 있도록 합니다.
import os
from together import Together
import gradio as gr
import base64
from io import BytesIO
from PIL import Image
client = Together(api_key=os.environ.get('TOGETHER_API_KEY'))
def generate_image(prompt):
response = client.images.generate(
prompt=prompt,
model="black-forest-labs/FLUX.1.1-pro",
width=1024,
height=768,
steps=1,
n=1,
response_format="b64_json",
update_at="2024-10-07T03:40:48.390Z"
)
# Base64 문자열을 이미지로 변환
image_data = response.data[0].b64_json
image = Image.open(BytesIO(base64.b64decode(image_data)))
return image
# Gradio 인터페이스 설정
interface = gr.Interface(fn=generate_image, inputs="text", outputs="image")
interface.launch()
4. 코드 실행: "python app.py" 명령으로 코드를 실행하면, http://127.0.0.1:7860/ 주소에서 아래와 같이 Flux 1.1 Pro 이미지 생성기 초기화면이 열립니다.
다음 화면은 "a watercolor painting of a whale in the sky" 프롬프트로 이미지를 생성한 화면입니다.
"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
마치며
이상으로 Flux 1.1 Pro의 주요 특징과 성능을 살펴보았습니다. Black Forest Labs가 선보인 이 최신 모델은 속도, 이미지 품질, 그리고 사용자 맞춤형 기능에서 획기적인 발전을 보여주었습니다. 또한 이전 모델보다 경쟁력 있는 가격을 제공하는 Flux 1.1 Pro는 다양한 분야의 크리에이터, 개발자 및 기업에게 강력한 도구가 될 것으로 보입니다.
Flux 1.1 Pro를 사용해 본 후기는 다음과 같습니다.
- 이미지 생성속도가 이전보다 아주 빠르다.
- 생성되는 이미지마다 품질과 완성도면에서 감탄을 불러일으킨다.
- 긴 텍스트를 포함하는 이미지를 생성하는 경우 몇 번의 재시도가 필요하다.
여러분도 직접 Flux 1.1 Pro를 테스트해 보시고, 창의적인 프로젝트에 어떻게 적용할 수 있을지 탐색해 보시면 좋을 것 같습니다. 그럼 저는 다음시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다!
2024.08.20 - [AI 도구] - 🚀FLUX GGUF로 고품질 AI 이미지를 빠르게 생성: ComfyUI 가이드
'AI 언어 모델' 카테고리의 다른 글
🏆NVIDIA Llama-3.1-nemotron-70B: GPT-4o를 뛰어넘은 오픈소스 모델 (36) | 2024.10.20 |
---|---|
🌟Aria: 최신 오픈소스 멀티모달 네이티브 MoE 모델 (25) | 2024.10.14 |
🎬Movie Gen: 메타의 차세대 미디어 생성 AI 모델🤖 (30) | 2024.10.05 |
👁️🤖Llama 3.2: 에지 컴퓨팅과 비전까지 확장한 Meta의 AI 모델 (36) | 2024.09.28 |
🚀Qwen2.5: 오픈소스 모델 최고 성능! MMLU 86.1% HumanEval 88.4% 달성! (29) | 2024.09.26 |