这是第二十二篇笔记,也是“实用工具”系列的第八期。
写到现在,我发现自己越来越喜欢琢磨AI的“逆向”能力——不光能听指令干活,还能反过来从现成的东西里学。
上周刷手机看到一张海报,风格特别喜欢:暖色调、手绘感、排版干净,是那种“想用但不会做”的类型。
换以前,我只能存下来,现在不一样了,我找到了一个方法,尝试让AI照着它,给我做一张类似的。
很多人以为AI“看图”就是认出来里面有什么东西。其实它能做的比这多。
我用的是豆包的图片分析功能(元宝、ChatGPT也都可以)。把那张海报上传,在对话框里输入:
“根据我提供的参考图,分析图片内容,生成一份详细的文本提示词,包括关键元素,场景,构图,色彩,色调,画面风格,背景要素,能够指导AI生图工具创作类似,作品字数在300个字以内,组合成一段话”
它给我的回复挺详细的:
这是一幅版画风格的城市秋景插画,采用中心对称构图,主体为一片完整的金黄色梧桐叶,叶片脉络清晰,内部嵌套上海城市天际线:包含东方明珠、上海中心大厦、外滩万国建筑、外白渡桥与苏州河,河水呈现蓝调波纹,倒映建筑。背景为米白色素净底色,下方配有竖排文字“拾·秋 上海·秋韵”及英文“Autumn in Shanghai”,并点缀红色篆刻印章。整体色调以暖金色与蓝调为主,线条硬朗分明,兼具现代都市与传统秋意,风格为极简复古版画,细节精致,留白充足,传递雅致的东方秋韵与城市人文气息。
AI反推出来的提示词,方向和原图一致,但不一定完全符合我的需要。
如果拿不准怎么改,也可以让AI帮忙——把原提示词和你的想法一起丢给它,说“帮我根据这个想法修改提示词”。
这一步是人和AI协作的关键:AI负责“翻译”,你负责“方向”。它不知道你想要什么,但你知道。
稍加修改后把这段提示词发给豆包:
这是一幅版画风格的城市秋景插画,采用中心对称构图,主体为一片完整的赤金银杏叶,叶片脉络清晰,内部嵌套北京秋日地标:包含故宫角楼、天坛祈年殿、长城烽火台、颐和园昆明湖、什刹海金叶、胡同四合院、北海公园白塔,湖水与建筑呈现鎏金波纹,相映成趣。背景为米白色素净底色,下方配有竖排文字“拾·秋 北京·秋韵”及英文“Autumn in Beijing”,并点缀红色篆刻印章。整体色调以银杏金与官墙红为主,线条硬朗分明,兼具皇家气韵与传统秋意,风格为极简复古版画,细节精致,留白充足,传递雅致的东方秋韵与京城人文气息。
。比例 3:4。
我用的是豆包的AI创作功能(元宝、Midjourney、DALL·E也都行)。把修改后的提示词粘贴进去,点发送。
等了几十秒,新海报出来了。
和原图比,风格很像,但内容不同。
当然,不是一次就完美。第一次带上参考图,豆包直接把上海的东方明珠塔照搬到了第二章北京的图里。
我重新修改了提示词进行创作
但是这次又出现了一些不搭嘎的文字,我用了消除功能进行删除
这次应该没有差错了,整体还是比较满意的。
这个过程让我意识到:生成图片和写文章一样,需要迭代。 第一次是初稿,不满意就改提示词,再跑,直到满意。
做完之后的几点感受
第一,AI“看懂”图的能力,比我想象的强。
它不光能认出“这是咖啡杯”,还能看出风格、色调、构图、留白方式……这些以前得靠设计师的经验才能描述的东西,它几秒钟就分析出来了。
第二,提示词是人和AI之间的“翻译器”。
反推出来的提示词,像一座桥——把一张图里的“感觉”翻译成AI能执行的“指令”。有了这座桥,我就不用从零开始想怎么写提示词了。
第三,最难的不是技术,是想清楚自己要什么。
提示词可以反推、可以修改,但“我想做奶茶主题而不是咖啡”“我想要更清新的配色”——这些方向性的判断,还得自己拿主意。
工具越来越聪明,但“要做什么”这个决定,还是得人来做。