Ideogram 4 开源发布:本地部署打造专业级 AI 图像创作工作流
Ideogram 官方近日正式开源 Ideogram 4(9B 参数版本)。作为 AI 绘图领域的顶尖模型,Ideogram 4 在文字渲染、海报设计及商业视觉创作方面展现了极高的水准,被认为是目前少数能与 Midjourney 及 GPT-Image 媲美的开源模型。
本次开源支持本地部署、LoRA 微调以及 ComfyUI 工作流,让用户能够彻底摆脱云端限制,在本地环境中实现高精度的商业级创作。
核心特性
- 卓越的文字与布局能力:深度优化文字生成与排版,支持结构化 JSON Prompt,精准控制图片内容、布局及光照。
- 顶尖的性能基准:在布局控制(7Bench)、空间推理(SpatialGenEval)及文本渲染(X-Omni OCR)等基准测试中表现出色。
- 商业级创作体验:在专业设计师盲测中,Ideogram 4 的胜率远超同类开源模型,能够精准还原设计稿需求。
本地部署指南
为获得最佳创作体验,建议使用 ComfyUI 进行部署。
1. 模型准备
请下载以下模型文件,并按目录结构存储:
- 模型存储目录:
ComfyUI/models/diffusion_models/:ideogram4_fp8_scaled.safetensors,ideogram4_unconditional_fp8_scaled.safetensorstext_encoders/:qwen3vl_8b_fp8_scaled.safetensors,gemma4_e4b_it_fp8_scaled.safetensorsvae/:flux2-vae.safetensors
下载 Ideogram 4 开源模型
(2)单独下载:【ideogram4_fp8_scaled】、【ideogram4_unconditional_fp8_scaled】、【qwen3vl_8b_fp8_scaled】、【gemma4_e4b_it_fp8_scaled】、【flux2-vae】
2. 软件环境
请确保安装最新版本的 ComfyUI 客户端,以兼容最新的生图工作流。
3. 工作流导入
下载对应的 ComfyUI 工作流配置文件,直接拖入软件界面即可加载使用。
实测参考 (Prompt 示例)
Ideogram 4 的强大之处在于对复杂描述的精确解析。以下是一个简单的场景描述示例:
A high-resolution portrait photograph of a stunning mixed Asian woman with distinctive K-pop inspired styling and natural beauty. She has flowing long black hair that cascades over her shoulders, large expressive dark eyes with subtle makeup, and naturally full lips that create a captivating smile. Her slim, athletic figure is elegantly posed in a confident yet playful stance, wearing delicate sheer lingerie in soft neutral tones. The scene is illuminated by warm, intimate bedroom lighting that creates a golden glow across her detailed, flawless skin, with soft shadows adding depth and dimension to the portrait.
通过使用结构化 JSON Prompt,你可以进一步细化每一个元素的坐标、材质与光照表现,从而实现对最终输出结果的深度掌控。
Ideogram 4 的开源为本地 AI 创作生态补齐了商业级视觉输出的最后一块拼图。无论你是 UI 设计师还是数字艺术创作者,这款模型都值得在你的本地工作站上进行部署与尝试。








