OpenAI Developers · Cookbook

GPT IMAGE 2 프롬프팅 가이드

OpenAI의 gpt-image 계열 모델을 실제 제작/디자인 워크플로우에서 안정적으로 쓰기 위한 한국어 웹페이지형 매뉴얼입니다. 원문의 흐름을 따라 모델 선택, 크기 제약, 프롬프트 구조, 생성/편집 사례를 한 번에 확인할 수 있게 정리했습니다.

원문 업데이트: 2026-04-21대상 모델: gpt-image-2 중심이미지 CDN 원문 링크 유지

1. 소개

gpt-image 생성 모델은 프로덕션 품질의 비주얼과 세밀하게 제어 가능한 크리에이티브 워크플로우를 목표로 설계되었습니다. 전문 디자인 작업, 반복형 콘텐츠 제작, 고품질 렌더링, 빠른 저지연 생성 흐름에 모두 사용할 수 있습니다.

핵심 역량: 사실적인 조명/재질, 품질-지연시간 선택, 얼굴·정체성 보존, 이미지 내 텍스트 렌더링, 인포그래픽/다이어그램, 스타일 제어, 현실 지식 기반 묘사.

이 가이드는 gpt-image-2를 중심으로 실제 프로덕션 사례에서 반복적으로 효과가 좋았던 프롬프팅 패턴을 정리합니다. 낮은 품질 설정은 속도가 중요한 작업에 유리하고, medium/high는 세밀한 품질이 중요한 결과물에 적합합니다.

2. OpenAI 이미지 모델 파라미터

모델별로 지원 품질, 입력 충실도, 해상도 제약, 추천 사용처가 다릅니다. 신규 제작은 기본적으로 gpt-image-2를 우선 검토하는 것이 좋습니다.

모델품질입력 충실도추천 사용
gpt-image-2low / medium / high기본 고충실도. input_fidelity 비활성신규 빌드 기본값. 포토리얼, 편집, 텍스트 많은 이미지, 합성, 정체성 보존.
gpt-image-1.5low / medium / highlow / high검증된 기존 워크플로우 유지용. 신규 작업은 gpt-image-2 권장.
gpt-image-1low / medium / highlow / high레거시 호환성. 새 프롬프트는 gpt-image-2로 이전 권장.
gpt-image-1-minilow / medium / highlow / high대량 변형, 빠른 아이데이션, 초안·저비용 작업.

gpt-image-2 크기 제약

  • 최대 변 길이는 3840px 미만
  • 가로/세로는 16의 배수
  • 긴 변과 짧은 변 비율은 3:1 이하
  • 총 픽셀 수는 8,294,400 이하, 655,360 이상
  • 2560×1440 초과는 실험적 영역으로 보고 결과 편차를 감안

자주 쓰는 크기

HD 세로1024×1536표준 세로형
HD 가로1536×1024표준 가로형
정사각형1024×1024범용 기본값
2K/QHD2560×1440신뢰성 좋은 상한선
4K/UHD3840×2160실험적. 필요 시 3824×2144처럼 유효 크기로 조정
마이그레이션은 프롬프트를 처음부터 갈아엎기보다, 기존 프롬프트를 유지한 채 품질·지연시간·재시도율을 실제 워크로드에서 비교한 뒤 필요한 부분만 조정하는 방식이 안전합니다.

3. 프롬프팅 기본기

  • 구조 + 목표: 배경/장면 → 주제 → 핵심 디테일 → 제약 순서로 쓰고, 광고·UI 목업·인포그래픽 같은 사용 목적을 명시합니다.
  • 형식: 짧은 문장, 설명형 단락, JSON 유사 구조, 태그형 모두 가능하지만, 운영 환경에서는 읽고 유지하기 쉬운 템플릿이 좋습니다.
  • 구체성: 재질, 형태, 질감, 매체를 명확히 씁니다. 포토리얼이면 “photorealistic”을 직접 넣는 것이 효과적입니다.
  • 속도 vs 품질: 대량·저지연 작업은 quality="low"부터 평가합니다. 작은 텍스트, 인포그래픽, 인물 클로즈업, 정체성 보존은 medium/high 비교가 필요합니다.
  • 구도: 프레이밍, 시점, 조명, 배치(예: 로고는 오른쪽 위)를 구체적으로 지정합니다.
  • 사람/포즈/행동: 전신 여부, 시선, 손의 위치, 물체와의 상호작용을 명확히 씁니다.
  • 보존 조건: 편집에서는 “change only X”와 “keep everything else the same”을 반복해 드리프트를 줄입니다.
  • 이미지 내 텍스트: 정확한 문구는 따옴표나 대문자로 쓰고, 폰트/크기/색/위치를 제약합니다.
  • 멀티 이미지: Image 1, Image 2처럼 각 입력을 번호와 설명으로 참조합니다.
  • 반복 개선: 한 번에 과부하를 주기보다 기본 프롬프트에서 작은 변경을 순차 적용합니다.

4. Setup

원문 노트북은 API 클라이언트를 만들고, 입력/출력 이미지 폴더를 준비한 뒤, base64 결과 이미지를 저장하는 helper를 둡니다.

import os
import base64
from openai import OpenAI

client = OpenAI()

os.makedirs("../../images/input_images", exist_ok=True)
os.makedirs("../../images/output_images", exist_ok=True)

def save_image(result, filename: str) -> None:
    image_base64 = result.data[0].b64_json
    out_path = os.path.join("../../images/output_images", filename)
    with open(out_path, "wb") as f:
        f.write(base64.b64decode(image_base64))

5. Use Cases — Generate (text → image)

아래 사례들은 텍스트만으로 이미지를 생성하는 대표 워크플로우입니다. 설명은 한국어로 정리했고, 실제 Prompt 문구는 재사용성을 위해 원문 영어를 유지했습니다.

4.1 Infographics

인포그래픽

학생, 임원, 고객, 대중에게 구조화된 정보를 설명할 때 적합합니다. 복잡한 레이아웃이나 이미지 안 텍스트가 많다면 quality는 high를 우선 검토합니다.

Prompt
Create a detailed Infographic of the functioning and flow of an automatic coffee machine like a Jura.
From bean basket, to grinding, to scale, water tank, boiler, etc.
I'd like to understand technically and visually the flow.
4.2 Translation in Images

이미지 속 텍스트 번역

광고, UI 스크린샷, 패키지, 인포그래픽을 다른 언어로 현지화할 때 사용합니다. 텍스트 외의 레이아웃·아이콘·이미지는 보존해야 합니다.

Prompt
Translate the text in the infographic to Spanish. Do not change any other aspect of the image.
4.3 Photorealistic Images that Feel “natural”

자연스러운 포토리얼 이미지

실제 사진을 찍는 것처럼 렌즈, 조명, 프레이밍, 피부/천/재료의 불완전한 질감을 구체적으로 씁니다.

Prompt
Create a photorealistic candid photograph of an elderly sailor standing on a small fishing boat.
He has weathered skin with visible wrinkles, pores, and sun texture, and a few faded traditional sailor tattoos on his arms.
He is calmly adjusting a net while his dog sits nearby on the deck. Shot like a 35mm film photograph, medium close-up at eye level, using a 50mm lens.
Soft coastal daylight, shallow depth of field, subtle film grain, natural color balance.
The image should feel honest and unposed, with real skin texture, worn materials, and everyday detail. No glamorization, no heavy retouching.
4.4 World knowledge

세계지식 기반 장면

모델이 장소·시대·문화적 맥락을 추론해 장면을 구성할 수 있습니다. 역사적/지리적 상황을 간결하게 제시합니다.

Prompt
Create a realistic outdoor crowd scene in Bethel, New York on August 16, 1969.
Photorealistic, period-accurate clothing, staging, and environment.
4.5 Logo Generation

로고 생성

브랜드 성격, 사용처, 단순성, 독창성, 확장성을 명확히 씁니다. n 파라미터로 여러 시안을 생성할 수 있습니다.

Prompt
Create an original, non-infringing logo for a company called Field & Flour, a local bakery.
The logo should feel warm, simple, and timeless. Use clean, vector-like shapes, a strong silhouette, and balanced negative space.
Favor simplicity over detail so it reads clearly at small and large sizes. Flat design, minimal strokes, no gradients unless essential.
Plain background. Deliver a single centered logo with generous padding. No watermark.
4.6 Ads Generation

광고 이미지

기술 스펙보다 크리에이티브 브리프처럼 작성합니다. 브랜드, 타깃, 문화적 분위기, 카피, 구도, 톤을 함께 줍니다.

Prompt
Give me a cool in culture ad / fashion shot for a brand called Thread.
It's a hip young street brand. The ad shows a group of friends hanging out together with the tagline "Yours to Create."
Make it feel like a polished campaign image for a youth streetwear audience: stylish, contemporary, energetic, and tasteful.
Use clean composition, strong color direction, natural poses, and premium fashion photography cues.
Render the tagline exactly once, clearly and legibly, integrated into the ad layout.
No extra text, no watermarks, no unrelated logos.
4.7 Story-to-Comic Strip

스토리 → 코믹 스트립

패널별로 하나의 시각적 비트를 정의합니다. 구체적이고 행동 중심으로 써야 흐름이 읽히는 만화가 됩니다.

Prompt
Create a short vertical comic-style reel with 4 equal-sized panels.
Panel 1: The owner leaves through the front door. The pet is framed in the window behind them, small against the glass, eyes wide, paws pressed high, the house suddenly quiet.
Panel 2: The door clicks shut. Silence breaks. The pet slowly turns toward the empty house, posture shifting, eyes sharp with possibility.
Panel 3: The house transformed. The pet sprawls across the couch like it owns the place, crumbs nearby, sunlight cutting across the room like a spotlight.
Panel 4: The door opens. The pet is seated perfectly by the entrance, alert and composed, as if nothing happened.
4.8 UI Mockups

UI 목업

이미 존재하는 제품처럼 설명합니다. 레이아웃, 계층, 여백, 실제 인터페이스 요소에 집중하면 콘셉트 아트가 아니라 제품 화면처럼 나옵니다.

Prompt
Create a realistic mobile app UI mockup for a local farmers market.
Show today’s market with a simple header, a short list of vendors with small photos and categories, a small “Today’s specials” section, and basic information for location and hours.
Design it to be practical, and easy to use. White background, subtle natural accent colors, clear typography, and minimal decoration.
It should look like a real, well-designed, beautiful app.
4.9 Scientific / Educational Visuals

과학/교육 시각자료

대상 학습자, 필수 구성요소, 포함하지 말아야 할 요소를 명시합니다. 라벨이 많은 자료는 high 품질을 권장합니다.

Prompt
Create a simple biology diagram titled "Cellular Respiration at a Glance" for high school students.
Show how glucose turns into energy inside a cell. Include glucose, oxygen, mitochondria, ATP, carbon dioxide, and water.
Use clean labels, arrows, and a friendly educational style.
4.10 Slides, Diagrams, Charts, and Productivity Images

슬라이드/다이어그램/차트

산출물 자체를 명확히 지정합니다. 슬라이드, 워크플로우, 차트, 페이지 이미지 등 캔버스와 정보 계층을 구체화합니다.

Prompt
Create one pitch-deck slide titled **"Market Opportunity"** that feels like a real Series A fundraising slide from a YC-backed startup.
Use a clean white background, large headline, three metric cards, and one simple chart.
Make the typography sharp and presentation-ready.

6. Use cases — Edit (text + image → image)

편집 워크플로우에서는 “무엇을 바꿀지”와 “무엇을 절대 보존할지”를 분리해 써야 합니다. 특히 정체성, 레이아웃, 조명, 텍스트, 로고, 카메라 각도는 매 반복마다 다시 고정하는 편이 좋습니다.

5.1 Style Transfer

스타일 전이

입력 이미지의 팔레트, 질감, 붓터치, 필름 그레인을 유지하면서 주제나 장면만 바꾸는 작업입니다. 무엇을 유지하고 무엇을 바꿀지 분리해야 합니다.

Prompt
Use the same style from the input image and generate a man riding a motorcycle on a white background.
5.2 Virtual Clothing Try-On

가상 의류 피팅

커머스 미리보기에서 유용합니다. 얼굴, 체형, 포즈, 머리, 표정은 잠그고 의상만 바꾸도록 명시합니다.

Prompt
Edit the image to dress the woman using the provided clothing images. Do not change her face, facial features, skin tone, body shape, pose, or identity in any way.
5.3 Drawing → Image

드로잉 → 포토리얼 렌더

러프 스케치를 사실적인 콘셉트 이미지로 바꿀 때 사용합니다. 원래 레이아웃과 원근은 보존하고, 재료·조명·환경을 추가합니다.

Prompt
Turn this drawing into a photorealistic image.
Preserve the exact layout, proportions, and perspective.
Choose realistic materials and lighting consistent with the scene.
5.4 Product Mockups

제품 목업/깨끗한 배경

카탈로그·마켓플레이스용 제품 추출에 적합합니다. 실루엣, 그림자, 라벨 선명도, 배경 불투명도를 제약합니다.

Prompt
Extract the product from the input image and place it on a plain white opaque background.
Output: centered product, crisp silhouette, no halos/fringing.
Preserve all label text exactly.
5.5 Marketing Creatives with Real Text

실제 텍스트가 들어간 마케팅 크리에이티브

카피는 따옴표로 정확히 쓰고, 추가 글자 금지, 배치, 타이포 스타일을 지정합니다.

Prompt
Create a realistic billboard mockup of the shampoo on a highway scene during sunset.
Billboard text (EXACT, verbatim, no extra characters):
"Fresh and clean"
5.6 Lighting and Weather Transformation

조명/날씨 변환

사진의 구도는 유지하면서 계절, 시간대, 날씨만 바꾸는 작업입니다. 환경 조건만 변경한다고 써야 합니다.

Prompt
Make it look like a winter evening with snowfall.
5.7 Object Removal

오브젝트 제거

불필요한 물체만 제거하고 주변 장면, 조명, 포즈, 색감은 유지하도록 지시합니다.

Prompt
Remove the flower from man's hand. Do not change anything else.
5.8 Insert the Person Into a Scene

사람을 장면에 삽입

정체성 보존이 중요한 스토리보드/캠페인에 적합합니다. 자연광, 그림자, 카메라 관점, 장면 물리성을 함께 고정합니다.

Prompt
Generate a highly realistic action scene where this person is running away from a large, realistic brown bear attacking a campsite. The image should look like a real photograph with natural lighting and believable motion.
5.9 Multi-Image Referencing and Compositing

멀티 이미지 참조/합성

여러 입력 이미지의 요소를 하나의 장면으로 합칩니다. 어떤 이미지에서 무엇을 가져올지 번호로 명확히 지정합니다.

Prompt
Place the dog from the second image into the setting of image 1, right next to the woman, use the same style of lighting, composition and background. Do not change the woman.

7. Additional High-Value Use Cases

아래는 제품화·마케팅·출판·커머스에서 가치가 높은 추가 사례입니다.

6.1 Interior design swap

인테리어 정밀 교체

실내 사진에서 가구·소품 하나만 교체하고 카메라 각도, 조명, 그림자, 주변 물체를 보존합니다.

Prompt
In this room photo, replace ONLY white with chairs made of wood.
Preserve camera angle, room lighting, floor shadows, and surrounding objects.
Keep all other areas unchanged.
6.2 3D pop-up holiday card

3D 팝업 홀리데이 카드

종이 레이어, 섬유, 접힘, 스튜디오 조명을 강조해 실제 촬영한 물리 제품처럼 보이게 합니다.

Prompt
Create a tactile 3D pop-up holiday card featuring a cozy Christmas scene with an old teddy bear inside a keepsake box. Emphasize paper layers, folds, fibers, and soft studio lighting.
6.3 Collectible Action Figure / Plush Keychain

수집형 피규어/키링 콘셉트

초기 굿즈 아이데이션과 피치 비주얼에 적합합니다. 제품 사진, 소재, 패키징, 프린트 선명도를 강조합니다.

Prompt
Create a premium product-style collectible concept based on a vintage-style toy propeller airplane with rounded wings, front-mounted propeller, slightly worn paint, and original non-infringing packaging.
6.4 Children’s Book Art

아동도서 캐릭터 일관성

여러 페이지 일러스트에서 캐릭터 드리프트를 줄이기 위해 character anchor를 먼저 만들고, 이후 장면에 참조로 사용합니다.

Prompt
Create a children’s book illustration introducing a main character. Then reuse that character anchor in a second scene while preserving the same face, costume, proportions, and illustration style.

결론

이 가이드는 GPT 이미지 생성 모델로 고품질·고제어 이미지 생성/편집 워크플로우를 구축하는 방법을 보여줍니다. 좋은 결과의 핵심은 모델 선택보다도, 목표·구도·보존 조건·텍스트 제약·참조 이미지 관계를 명확히 쓰고 작은 단위로 반복 개선하는 것입니다.

실무 추천: 신규 작업은 gpt-image-2를 기본값으로 두고, 빠른 대량 생성은 quality="low"부터 평가, 텍스트/인물/세밀한 편집은 medium/high로 검증하세요.

(주)소이랩엑스

대표이사 : 최돈현 | 사업자번호 : 229-88-03061 

이메일 : contact@soylab.ai 

주소 : 서울시 구로구 디지털로 26길 43 대륭포스트타워 8차 L동 1008호

Copyright © 2025 SoylabX All rights reserved. |  Terms of Use  |  Privacy

(주)소이랩엑스

대표이사 : 최돈현 | 사업자번호 : 229-88-03061 | 이메일 : contact@soylab.ai 

주소 : 서울시 구로구 디지털로 26길 43 대륭포스트타워 8차 L동 1008호

Copyright © 2025 SoylabX All rights reserved. |  Terms of Use  |  Privacy