黑森林实验室:从Stable Diffusion走出的新力量
Black Forest Labs(黑森林实验室)是一个专攻AI图像与视频生成的创意团队。它的创始人Robin Rombach曾是StabilityAI的核心成员,团队里不少人也来自Stable Diffusion的原始开发班底。2024年,他们在德国成立了这个实验室,目标很明确:用更先进的AI技术,继续在图像和视频生成领域搞点新名堂。
团队背景
这帮人可不是新手,他们在AI和机器学习,特别是图像处理和大模型开发上经验老道。他们的想法也挺实在:做出能真正理解需求、生成高质量图片的AI,帮大家把脑子里那些天马行空的创意变成看得见的画面。
FLUX.1模型:一套三款,总有一款适合你
FLUX.1是黑森林实验室推出的文本生成图像模型套装,里面包含了三个性格各异的“兄弟”:FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell]。
FLUX.1[pro]:专业版
- 特点:闭源模型,性能最强。在理解提示词、图像质量、细节呈现和输出多样性上,都算是当前顶尖水平。
- 怎么用:可以通过Replicate和fal.ai平台体验,需要注册账号并获取API密钥。
FLUX.1[dev]:开发版
- 特点:开源模型,但不能商用。它是从[pro]版“蒸馏”出来的,图像质量和理解提示词的能力差不多,但效率更高。
- 怎么用:在fal.ai和HuggingFace平台上可以直接尝鲜,不用注册。
FLUX.1[schnell]:快速版
- 特点:开源模型,可以商用。专门为本地开发和个人使用优化,生成速度最快,对电脑内存也最友好。
- 怎么用:同样可以在fal.ai和HuggingFace上直接体验,无需注册。
FLUX.1能做什么?有什么绝活?
FLUX.1不光能根据文字画画,还自带一套图像编辑工具箱,让创作和修图变得更灵活。
图像编辑工具
- FLUX.1 Fill 重绘模型:可以编辑和扩展图片,不管是实拍图还是AI生成的图都行,比如把图片里不想要的部分抹掉重画,或者把画面往外延伸。
- FLUX.1 Depth 和 Canny 模型:这两个模型能读取输入图片的深度信息或边缘轮廓,然后结合你的文字描述,重新绘制一张新图。
- FLUX.1 Redux 模型适配器:给一张图,再加点文字提示,它就能对原图进行微调优化,生成一张略有不同但更符合你心意的版本。
技术特点
FLUX.1模型的训练参数达到了120亿,这个规模超过了Midjourney v6.0和DALL·E3(HD)等同类模型。它在图像质量、准确理解提示词、适应不同尺寸、处理文字排版以及输出多样性上都表现突出,尤其是在生成图像的清晰度、细节真实感和复杂场景方面优势明显。
如何获取和使用FLUX.1模型?
获取方式
- FLUX.1[pro]:需要去官方注册申请API访问权限。
- FLUX.1[dev] 和 FLUX.1[schnell]:可以直接从HuggingFace下载。其中[dev]版本需要登录并同意开源许可协议。
使用平台
- Replicate:一个云平台,你可以在上面运行和微调机器学习模型。
- fal.ai:一个面向开发者的生成式媒体平台,提供AI推理API。
- HuggingFace:知名的AI模型社区,支持直接体验FLUX.1模型。
根据自己的需要和技术水平,选对版本和平台,你就能开始用FLUX.1玩转AI图像生成了。