
Black Forest Labs 刚刚发布了 FLUX.2,这是一个巨大的飞跃。从 4MP 分辨率到多参考图支持,以下是它对创作者和开发者如此重要的原因。
我构建 Zemith 已经有一段时间了,如果说我对 AI 领域有什么了解的话,那就是“新”并不总是意味着“更好”。我们每周都能看到新模型发布,伴随着各种炒作,但很少能在最初几天的实际测试中存活下来。
但 Black Forest Labs 是个例外。当他们发布最初的 FLUX 时,它真正改变了格局。这不仅仅是炒作;它是创作者真正想要使用的工具。
现在,他们推出了 FLUX.2,在深入研究规格并看到它的能力后,我不得不说:这感觉像是另一次飞跃,而不仅仅是一小步。
以下是我对 FLUX.2 有何不同,以及如果你正在使用 AI 进行构建或创作,为什么它很重要的看法。
FLUX.2 是 Black Forest Labs 的第二代图像生成系统。它建立在潜在流匹配架构之上——具体来说是将 Mistral-3 24B 参数视觉语言模型与整流流 Transformer (rectified flow transformer) 相结合。
如果这听起来像技术术语,翻译过来就是:它更了解这个世界。 它不仅仅是将关键词匹配到像素;它对空间关系、材质属性和现实世界的逻辑有更深刻的理解。
但规格是一回事。功能才是我们实际使用的。以下是我认为最突出的几点。
这是最重要的一点。FLUX.2 允许你将多达 10 张参考图像 组合成单个输出。
对于任何从事品牌建设、角色设计或连贯叙事的人来说,这都是巨大的进步。你不再只是希望模型记住你的角色长什么样;你是在给它蓝图。它实现了以前如果不进行复杂的微调就是噩梦般的资产一致性水平。
我们谈论的是高达 400 万像素 的原生生成分辨率。这是印刷级的质量。
但这不仅仅是像素数量的问题。“AI感”——那种困扰许多模型的奇怪塑料光泽——在这里显著减少了。纹理更清晰,光线更稳定,细节感觉更扎实。对于产品摄影或高端可视化来说,这是一个重大的升级。
我们都曾与 AI 文本做过斗争。你要求一个写着“Coffee”的牌子,结果得到的是用外星象形文字写的“Cofefe”。
FLUX.2 在这方面取得了重大进展。它可以可靠地渲染复杂的排版、信息图表和 UI 模型,文本清晰细腻。对于模拟概念的设计师来说,这节省了数小时的 Photoshop 工作。
他们引入了高级控制原语,如十六进制颜色导向和直接姿态控制。这让我们更接近于“指导”AI,而不仅仅是提示它。你可以告诉它你想要 确切 的什么颜色,或者某人应该 确切 如何站立。
Black Forest Labs 明白一种尺寸不能满足所有需求。他们发布了一个模型家族:
这种分层方法很聪明。它承认业余爱好者、研究人员和制作工作室有着完全不同的需求。
作为一名创始人,我看着像 FLUX.2 这样的工具,看到了机会。创建专业级视觉资产的门槛正在迅速降低。
使用 JSON 提示和结构化指令的能力意味着我们可以在这些模型之上构建更可靠、程序化的工作流。它不再是老虎机,而开始成为渲染引擎。
我们相信在最好的工具准备好时立即为您提供访问权限。这就是为什么我很兴奋地分享 FLUX.2 现在已经在 Zemith 上可用。
你不需要设置复杂的本地环境或管理 API 密钥。我们已将其直接集成到我们的平台中。你可以测试它的多参考功能,挑战分辨率极限,看看它是否适合你的工作流。
无论你是为下一个活动生成资产,还是只是探索生成式 AI 的前沿,FLUX.2 都值得你花时间。
准备好看看 FLUX.2 能做什么了吗? 立即在 Zemith 上试用。
一个订阅替代五个。每个顶级AI模型、每个创意工具和每个生产力功能,都在一个专注的工作空间中。
ChatGPT、Claude、Gemini、DeepSeek、Grok 及25+模型
语音 + 屏幕共享 · 即时回答
学习一门新语言的最佳方式是什么?
沉浸式学习和间隔重复效果最好。尝试每天消费目标语言的媒体内容。
语音 + 屏幕共享 · AI 实时回答
Flux、Nano Banana、Ideogram、Recraft + 更多

AI自动补全、改写和按命令扩展
PDF、URL或YouTube → 聊天、测验、播客等
Veo、Kling、MiniMax、Sora + 更多
自然AI语音,30+语言
编写、调试和解释代码
上传PDF,分析内容
iOS和Android完整访问 · 随处同步
聊天、图像、视频和动态工具 — 并排展示

节省数小时的工作和研究时间
受信赖的企业团队
无需信用卡