
智脑团改造计划:AI图像处理实验 - 第2篇/共5篇

智脑团改造计划:AI图像处理实验 - 第2篇/共5篇
第二篇:Flux、cgdream.ai与Think Diffusion实战测评
第一篇, 中,我们解析了Manus的建议方案并做好实验准备。本篇将实测三款AI图生图工具对「阿加莎·智脑」的改造效果。
在智脑形象改造系列的第二部分,我们将对Flux、cgdream.ai和Think Diffusion进行测试。这些工具专注于AI驱动的图像到图像生成,承诺在保留智脑核心特征的同时优化其设计。
我们的尝试
1.从阿加莎·克里斯蒂的面部特征中提取关键元素 2.上传当前版本的文本模型智脑形象 3.应用面部特征,增强细节,并根据Manus的反馈进行修正 4.快速比较输出结果在清晰度、创意性和品牌契合度方面的表现
究竟哪个工具能提供最专业精致的成果?让我们一探究竟!
分析过程
我们使用
Reverse Prompt
网站从
阿加莎·克里斯蒂的照片
提取特征
一张黑白老照片,女性手托下巴,meret elisabeth oppenheim风格,目录照片,georgia o'keefe风格,肖像画,灵感源自Mildred Eldridge,pilar gogar风格,alice russell glenny风格,宣传肖像,margaret watts hughes风格,Mildred Eldridge创作,agnes pelton风格(上述风格为各流派艺术家风格)
这并非我们所需,它没有描述人物的面部特征。
我们尝试使用另一个AI工具
Flux AI:
后得到
一位成熟女性的迷人肖像,灰白卷发优雅盘起,沉思姿态手托下巴。极简主义背景呈现暗到亮的渐变,突出面部特征。戏剧性柔光强调面部轮廓,微妙阴影为沉思智慧的表情增添层次。三分构图营造平衡感,黑色上衣与莹润肤色形成美丽对比。图像具有20世纪中叶经典黑白摄影的永恒质感,传递内省与优雅的女性力量。风格受尤素福·卡什和理查德·阿维顿等肖像大师启发,以简约布光和情感表达捕捉人物精髓。
我们还尝试了
Flux AI Lab:
黑白照片,优雅年长女性,特写,白色卷发,深色套装,手托脸颊,沉思表情,柔光,复古风格,影棚布景,1930s时尚,单色调,高对比度,经典肖像,精细细节,永恒之美,怀旧氛围,摄影师未知,艺术构图,历史感,精致格调
和
Image Prompt:
中年高加索女性微偏左构图,头部前倾,视线低垂避开观众。1930-40年代经典波浪卷发,黑色外套配细链项链。右手托左颊的黑白肖像,戏剧性阴影突出面部特征,影棚布光营造沉思氛围。构图聚焦上半身,建立亲密感。
N这些描述都过于侧重构图、光线和服饰,未能准确捕捉阿加莎的面部特征。仅头发被提及,眼睛、鼻子、嘴唇等关键特征完全缺失。因此我们自行编写:
添加以下人类特征:六十余岁优雅英国女性,橄榄形深蓝眼睛,挺直大鼻子,精致玫瑰色嘴唇,中等颧骨,白色卷发,浓密白眉毛,眼角细纹。将羽毛替换为古典书籍。
Flux 图生图测试
测试1
将原始文本模型的智脑图片上传到 Flux 图生图 ,应用上述提示词。将参数参考图像强度(Reference Image Strength)设置为 0.90,并开启了原始模式(Raw Mode)。
眼球看起来不错,(半个)鼻子也还行,而且还有一本书。所以部分指令是生效了的。
存在几个问题:
- 风格从3D模型变成了卡通,
- 因为原始的智脑只有一只眼睛,所以本次也只生成了一只眼睛。
- 羽毛并没有被移除,
- 我们看不到她的脚了。
我们将 参考图像强度(Reference Image Strength) 设置为 0.50 并且将提示词改成:
给角色手中添加一本打开的老式书籍。移除羽毛。使所有特征对称。添加以下人类特征:一位六十多岁的优雅英国女性,橄榄形脸上有两只深蓝色的眼睛,一个挺直的大鼻子,精致的玫瑰色嘴唇,中等高度的颧骨,卷曲的白色头发,浓密的白色眉毛,以及眼角处细微的皱纹。
很遗憾,我们用完了免费积分,无法继续测试这个工具了。
使用Flux的结论
我们无法通过运行单个测试得出任何结论。初始积分数量不足以评估该平台。
cgdream.ai
我们在 cgdream 创建了一个账户,看到非常不同的交互界面: 屏幕右侧有几个参数,左侧有 5 个用于上传元素的位置:
- 风格
- 结构
- 参考
- 3D 模型
- 角色
测试 1
我们使用智脑作为角色和风格,保持默认强度为 1,将模型更改为 SDXK (Juggernaut XL),将提示指导值提高到 7,并激活了创意模式。之前的提示给出了这个结果:
所以这个提示词并不能直接修改图像,它必须是一个包含所有特征的完整提示词。并且强度 1 应该被降低,以使与原始图像的相似度更强,这是反直觉的。
测试 2
我们将智脑图片从“角色”移动到“图像”,并使用默认强度值 0.5。我们仍然将智脑作为一个风格参考。我们尝试了这个完整的提示:
一个 B2B 品牌的三维吉祥物,形状像大脑。这个大脑拥有以下人类特征:一位六十多岁的优雅英国女性,橄榄形脸上有一双深蓝色的眼睛,一个挺直的大鼻子,细嫩的玫瑰色嘴唇,中等高度的颧骨,卷曲的白色头发,浓密的白色眉毛,以及眼角处细微的皱纹。大脑手中拿着一本老式书籍。它有细长的手臂和腿。吉祥物的背景是白色的。
结果有所改善:
- 风格保持一致,
- 我们添加了人类特征(蓝色的眼睛、薄嘴唇、一个鼻子、卷曲的头发融入大脑),
然而,我们并没有得到所有我们想要的元素:
- 书不见了,
- 眼镜是多余的
测试 3
因此,我们将对提示词的引导参数增加到 9。
现在书的元素出现了,但我们失去了“大脑”的感觉。现在(图像中)是一个大头。眼睛也太大,嘴巴也是。
我们还注意到提示词被重写了(很可能是因为创意标志/创意模式)。真实的提示词是:
这幅图像展示了一个为 B2B 品牌设计的 whimsical 3D 吉祥物,其形式为具有拟人化特征的大脑。这个大脑被拟人化为一位 60 多岁的优雅英国女性,通过她深邃的蓝绿色橄榄形眼睛、挺直的大鼻子和精致的玫瑰色嘴唇展现出 sophisticated 举止。她中等高度的颧骨和卷曲的白色头发增添了她的高贵气质,再加上她浓密的白眉毛和眼角处细微的皱纹,暗示着智慧和经验。
她右手拿着一本老式书籍,传达出知识和传统的意味,而她细长的手臂和腿让她看起来轻盈、平易近人。画面以干净的白色背景为衬托,突出了角色鲜艳的色彩和细节,让观众能够专注于吉祥物迷人的特征。光线柔和均匀,照亮了大脑的表面纹理和角色精致的面部特征,营造出一种邀请性和友好的氛围,这与品牌的既专业又平易近人的形象相吻合。
测试 4
在下一次尝试中,我们移除了“创意”标志(Creative Flag) ,以确认它会使用我们原始的提示词。
我们可以看到创意模式的好处。人物特征没有前两次测试那么好。我们决定在下一次测试中重新打开它。
测试 5
作为最后的尝试(我们的免费积分快用完了),让我们简化一切。我们重新打开创意模式,并使用以下提示词:
这是一个以大脑形状为原型的 B2B 品牌三维吉祥物。这个大脑拥有 60 多岁的阿加莎·克里斯蒂的人类特征,手里拿着一本老式书籍,有细长的手臂和腿。吉祥物背景为白色。
那更像洛夫克拉夫特笔下的生物,而不是阿加莎·克里斯蒂的。我们需要向模型提供关键的人类特征。
使用cgdream的结论
这个工具为我们提供了足够的免费积分来进行测试和学习。我们得到了有趣的结果。再进行几次试验,我们就能得到我们想要的结果。
我们选定了第 3 张和第 4 张图片作为最终比赛的候选作品。
Think Diffusion
登录后, Think Diffusion 会创建一个运行 A1111 的虚拟机,我们可以激活它 15 分钟。我们需要优化我们的时间来理解、执行和比较结果。
我们使用了 ‘img2img’ 选项,并保持所有默认参数,上传了智脑的文字说明作为参考。
我们对来自 cgdream 的创意提示词进行了微小的修改,这个提示词给我们带来了最好的结果。我们将异想天开的(whimsical)替换为严肃的(serious):
该图像展示了一个为 B2B 品牌设计的严肃 3D 吉祥物,其形式是一个具有拟人化特征的大脑。这个大脑被拟人化为一一位六十多岁的优雅英国女性,她通过深邃的蓝色橄榄形眼睛、挺直的大鼻子和纤细的玫瑰色嘴唇展现出精致的气质。她中等高度的颧骨和卷曲的白色头发增添了她的显赫外表,白色的粗眉和眼角处细微的皱纹更增添了智慧和经验的气息。
她右手拿着一本老式书籍,传递出知识和传统的气息,而她纤细的手臂和腿部让她看起来轻盈、平易近人。整个构图以干净的白色背景为衬托,突出了角色鲜艳的颜色和细节,让观众能够专注于吉祥物迷人的特征。光线柔和均匀,照亮了大脑表面的纹理和角色精致的面部特征,营造出一种亲切友好的氛围,这与品牌专业而又平易近人的形象相得益彰。
三次尝试过后,都没有生成图片,也没有出现错误信息、UI 提示或问题解释。
我们尝试了不同的选项和开关 10 分钟,然后停止了虚拟机。
使用Think Diffusion的结论
这个工具一点也不用户友好。它非常技术化,提供了许多底层参数。遗憾的是,默认参数没有产生任何结果。但最糟糕的是,用户根本不知道发生了什么,也不知道如何解决这个问题。
第2篇文章的总体结论
在测试了这三款工具后,只有 cgdream.ai 让我们能够继续推进改进智脑团的进程。Flux 没有提供足够的积分,而 Think Diffusion 证明是一个非常粗糙的工具箱,只适合那些有大量时间投入去理解参数的专家。
这代表着我们相对于最初的设计取得了明显的进步。
第3篇中,我们将探索更多的图片处理工具(Fotor、PhotoEditor.ai、consistory、Phot.ai、getimg)——这些工具是否能帮助我们进一步提升智脑团的质量?
我们在这里赋能
在System in Motion,我们的使命是为更多的知识工作者提供帮助。 开始或继续你的GenAI之旅。
你也应该阅读
