前几期做了柿咪咪的MV,这次想试试更有“分量”的东西——用柿咪咪拍一首古诗的AI视频。
我选了白居易的《卖炭翁》。这首诗我初中就背过,当时只觉得“宫使真坏”。现在再读,满脑子都是那个“衣正单、愿天寒”的老人——身上冷,却盼着天再冷一点,炭能卖个好价钱。
我想让柿咪咪来演这个卖炭翁。不是为了搞笑,是想用这种“反差”让更多人愿意停下来,听一听这个故事。
这篇记录一下全过程,从古诗到画面,从图片到视频,最后剪成一支带旁白的短片。
《卖炭翁》全诗22句,不需要每句都配图。我挑了几个关键场景:
1. 伐薪烧炭南山中
2. 满面尘灰烟火色,两鬓苍苍十指黑
3. 可怜身上衣正单,心忧炭贱愿天寒
4. 夜来城外一尺雪,晓驾炭车辗冰辙
5. 牛困人饥日已高,市南门外泥中歇
6. 翩翩两骑来是谁?黄衣使者白衫儿
7. 手把文书口称敕,回车叱牛牵向北
8. 半匹红绡一丈绫,系向牛头充炭直
我把这些场景描述和整首诗一起喂给豆包,指令是:
“请为《卖炭翁》的以下场景生成详细的画面描述,主角是柿咪咪,但需要表现出卖炭翁的辛劳和无奈。画风为古风水墨与温暖治愈结合,不能太悲苦,要有诗意的质感。”
AI生成了几段描述。
我微调了一下比如:
“小猫靠在炭窑边,面前摆着几小堆木炭,眼神疲惫而无奈。它身上穿着一件打满补丁的破旧小棉袄,肚子微微凹陷。旁边放着一个空碗和一根细小的鱼骨。画面用近景,突出小猫清苦的生存状态,色调以灰褐为主。”
第四段:
“柿咪咪赶着一头老牛拉的炭车,车轮压在冰雪覆盖的车辙上,雪花飘落,柿咪咪缩着身子,呼出白气。”
风格我选了“水墨淡彩手绘插画”,既保留古诗的意境,又让柿咪咪不显得太突兀。
用豆包的AI绘图功能。第一张“南山烧炭”的提示词:
“古风水墨淡彩,柿咪咪穿着粗布麻衣,在南山中砍柴,身后有炭窑冒烟,远山朦胧,雪景初现,温暖与清冷结合”
生成后,色调偏灰了。我加了“增加一点暖黄色的火光”,第二版就好多了。
为了保持风格一致,我把第一张满意的图作为参考,后面的提示词都加上“参考此图的色调、笔触和光影”。
有几个场景需要特别调整:
比如 “满面尘灰”:柿咪咪的脸不能太脏,保持可爱但带一点灰印就行
所有图断断续续生成了一个多小时。
静态图有了,接下来用图生视频功能,每张图生成4-5秒的短视频。
动作指令要配合诗的情绪。不能只是“动起来”,要“演”出那个状态。
比如:
“正午,集市南门外。老牛卧在泥泞的雪地上,鼻孔喘着粗气。小猫也从车上跳下来,靠在车轮旁坐下,前爪搭在饿扁的肚子上,嘴巴微张,舌头舔着干裂的嘴唇。炭车停在一旁,车上的炭堆得满满当当。背景里远处有稀疏的行人和摊位,但无人问津”
“辗冰辙”:
“柿咪咪赶着牛,炭车缓慢前行,车轮碾过冰面发出细微的咔嚓声,柿咪咪呼出白气,脚步沉重”
“宫使抢炭”:
“黄衣使者拉着炭车离开,柿咪咪站在原地,炭车渐远,柿咪咪低下头,身体微微颤抖,没有追”
最后一张“半匹红绡”:
“柿咪咪看着牛头上系着的红绡,伸出爪子轻轻碰了一下,然后缩回来,转身慢慢走远,背影越来越小”
生成过程中,有些动作不符合预期。“愿天寒”那一段,第一次生成柿咪咪的表情太平静,我加了“眉头微皱,嘴唇抿紧”,重新跑了一遍。
剪辑我用了剪映。这次和MV不同,不需要配唱歌,而是配古诗朗诵。
操作流程:
1. 把所有分段视频按诗句顺序拖进轨道
2. 导入BGM:选了剪映素材库里的“古琴+笛子”纯音乐,音量调低,当底衬
3. 加字幕和录制旁白:我把诗句逐句打在画面下方,还是用的剪映的文本朗读功能去录制旁白
4. 对齐:让旁白的每一句和对应的画面同步。比如念到“满面尘灰烟火色”时,正好切到柿咪咪灰扑扑的脸
5. 不加花哨转场,只用了“淡入淡出”
6. 导出
最难的是“情绪节奏”。到“心忧炭贱愿天寒”时,画面要停得久一点;念到“回车叱牛牵向北”时,画面切换要快一点,体现“抢”的急促。我反复调了几遍。
做完之后,我自己看了好几遍。柿咪咪站在雪地里发抖的那一段,配合“可怜身上衣正单”的旁白,心里确实有点酸。
做完之后的几点感受
第一,古诗+柿咪咪,不是恶搞,是让更多人“看进去”。
我担心过这样会不会不尊重原作。但做完之后觉得,柿咪咪的可爱反而让人更愿意停下来。如果直接放一张老翁的写实画,可能划几下就过去了。但看到一只小猫在雪里发抖,你会想“它在干嘛”——然后就读到了那首诗。
第二,AI做古诗视频,最难的不是技术,是“分寸”。
灰不能太多,悲不能太过,可爱不能盖过辛酸。调色调了很久,既要让画面有古意,又不能太暗。这个平衡不好把握。
第三,做这个视频,我自己把《卖炭翁》重新读懂了。
以前背诗是为了考试。这次为了给柿咪咪“导戏”,我把每一句都拆开想:这个动作是什么意思?这个情绪是什么样的?做完整条视频,我才真正理解了“心忧炭贱愿天寒”那种矛盾——冷得要死,却盼着更冷。