Ideogram 官方近日正式开源 Ideogram 4(9B 参数版本)。作为 AI 绘图领域的顶尖模型,Ideogram 4 在文字渲染、海报设计及商业视觉创作方面展现了极高的水准,被认为是目前少数能与 Midjourney 及 GPT-Image 媲美的开源模型。

本次开源支持本地部署、LoRA 微调以及 ComfyUI 工作流,让用户能够彻底摆脱云端限制,在本地环境中实现高精度的商业级创作。


核心特性

  • 卓越的文字与布局能力:深度优化文字生成与排版,支持结构化 JSON Prompt,精准控制图片内容、布局及光照。
  • 顶尖的性能基准:在布局控制(7Bench)、空间推理(SpatialGenEval)及文本渲染(X-Omni OCR)等基准测试中表现出色。
  • 商业级创作体验:在专业设计师盲测中,Ideogram 4 的胜率远超同类开源模型,能够精准还原设计稿需求。

本地部署指南

为获得最佳创作体验,建议使用 ComfyUI 进行部署。

1. 模型准备

请下载以下模型文件,并按目录结构存储:

  • 模型存储目录ComfyUI/models/
    • diffusion_models/: ideogram4_fp8_scaled.safetensors, ideogram4_unconditional_fp8_scaled.safetensors
    • text_encoders/: qwen3vl_8b_fp8_scaled.safetensors, gemma4_e4b_it_fp8_scaled.safetensors
    • vae/: flux2-vae.safetensors

下载 Ideogram 4 开源模型

(1)模型打包(推荐):【点击下载】或 【备用下载

(2)单独下载:【ideogram4_fp8_scaled】、【ideogram4_unconditional_fp8_scaled】、【qwen3vl_8b_fp8_scaled】、【gemma4_e4b_it_fp8_scaled】、【flux2-vae

2. 软件环境

请确保安装最新版本的 ComfyUI 客户端,以兼容最新的生图工作流。

点击前往】或 【备用下载

3. 工作流导入

下载对应的 ComfyUI 工作流配置文件,直接拖入软件界面即可加载使用。

点击下载】或 【备用下载


实测参考 (Prompt 示例)

Ideogram 4 的强大之处在于对复杂描述的精确解析。以下是一个简单的场景描述示例:

A high-resolution portrait photograph of a stunning mixed Asian woman with distinctive K-pop inspired styling and natural beauty. She has flowing long black hair that cascades over her shoulders, large expressive dark eyes with subtle makeup, and naturally full lips that create a captivating smile. Her slim, athletic figure is elegantly posed in a confident yet playful stance, wearing delicate sheer lingerie in soft neutral tones. The scene is illuminated by warm, intimate bedroom lighting that creates a golden glow across her detailed, flawless skin, with soft shadows adding depth and dimension to the portrait.

通过使用结构化 JSON Prompt,你可以进一步细化每一个元素的坐标、材质与光照表现,从而实现对最终输出结果的深度掌控。


Ideogram 4 的开源为本地 AI 创作生态补齐了商业级视觉输出的最后一块拼图。无论你是 UI 设计师还是数字艺术创作者,这款模型都值得在你的本地工作站上进行部署与尝试。