这是第二十九篇笔记,也是“实用工具”系列的第十五期。
前几周做了柿咪咪的毛毡动画,觉得不过瘾。这次想试试更“有情绪”的东西——做一支音乐MV。
歌词是我偶然看到的一段文字,讲的是离乡、流浪、篝火和星空。读了几遍,心里有点被戳中。我想让柿咪咪来“唱”这首歌。
不是真的唱,是用画面配歌词,一帧一帧把情绪讲出来。
这篇记录一下整个过程,从歌词到分镜,从图片到视频,最后剪成一支完整的MV。
依旧先放成品~
我用的还是豆包。把歌词复制进去,写了一句指令:
“以下是一段歌词,请帮我为每一句或每两句话生成一个对应的画面描述,风格统一为温暖治愈的插画风,主角是柿咪咪(一只小猫)。画面要能表达歌词的情绪。”
歌词贴进去后,AI很快给出了8个画面的描述:
1. “这一次我告别故乡,踏上我的流浪”
柿咪咪背着小包,站在村口回头望,身后是远山和炊烟。
2. “无知和久违的理想,像期待在前方”
柿咪咪站在岔路口,面前是一条伸向远方的路,晨光洒下来。
3. “妈妈的话充满梦想,我不会再度彷徨”
柿咪咪坐在行李箱上,手里拿着一张明信片,上面画着妈妈的笑脸。
4. “如今我背负了信仰,渐渐远离了家乡”
柿咪咪走在铁轨旁边,背影越来越小,天色渐暗。
5. “童年的梦境可笑的,就像是乌云隐藏着”
柿咪咪蹲在树旁,天空是乌云。
6. “外面的世界漆黑着,而我依然是一个篝火者”
柿咪咪在黑暗中举着一小团篝火,火光映红了脸。
7. “说着看星空突然变成黑色,象征篝火的我也会变得退缩”
柿咪咪抬头看天,星星一颗颗熄灭。
8. “我曾盼望繁星我才坚定的活着,接下来的故事慢慢仔细听我说”
柿咪咪坐在篝火旁,对着星空微笑。
每个描述都带着柿咪咪的形象和歌词的情绪。我觉得AI理解得不错,只微调一些地方把“铁轨”改成“乡间小路”,更符合柿咪咪的乡村感和一些小细节改动。
有了画面描述,接下来生成静态图。
我用豆包的AI绘图功能。为了保持整组图风格一致,我先用第一句歌词生成了一张参考图,然后在后面的提示词里都加上“基于此图的色彩和光影风格”。
第一张的提示词:
“温暖治愈插画风,柿咪咪(小猫)背着小包站在村口回望,身后有远山和炊烟,暖黄色调,柔和光影,水彩质感”
生成后,我觉得色调偏黄了,改了一下:“色调稍微偏橙红,增加一点黄昏感”。第二版好多了。
后面的每一张我都按这个套路:复制画面描述,加上“保持角色和风格与参考图一致”,然后生成。
有几张需要微调。比如“乌云”那张,第一版乌云太浓,像暴风雨。我改成“浅灰色云层,有微光透出”,就柔和了。“篝火”那张,火焰颜色一开始太红,改成“橙黄色火光,温暖不刺眼”。
/.8张图大概花了一个多小时,主要是调细节花时间。
静态图有了,但MV需要动态画面。我用豆包AI的图生视频功能,每张图生成4-5秒的短视频。
动作指令要配合歌词的情绪写,不能随便动。
比如第一张“告别故乡”:
“柿咪咪缓缓回头张望,微风吹动毛发,背景的炊烟轻轻飘动,动作缓慢,有离别的惆怅感”
“篝火”那张:
“篝火轻轻摇曳,柿咪咪双手靠近火源取暖,脸上光影闪烁,眼睛坚定”
“乌云”那张:
“乌云缓慢移动,雨滴偶尔落下,柿咪咪蜷缩着,身体微微发抖”
生成过程中,有些动作不符合预期。比如“篝火者”那一段,第一次生成柿咪咪的表情太平静,我加了“嘴角微微下垂,眼神坚定中带一点疲惫”,重新跑了一遍。
最终8段视频都生成了,每段4-5秒,总时长大概35秒。
最后一步是剪辑。我用剪映(手机版)。
操作流程:
1. 把8段视频按歌词顺序拖进轨道
2. 把BGM音频拖到音频轨道——我用的是歌手本人翻唱的版本,直接从音乐平台下载导入(注意版权,仅自己用没问题)
3. 逐句对齐:听一句歌词,切一段画面,让画面切换和歌词的节奏匹配
4. 加字幕:把歌词逐句打在画面下方
5. 加转场:每段之间用“叠化”,时长0.3秒,不抢戏
6. 导出:最高画质
最难的是“对齐”。歌词有快有慢,比如“说着看星空突然变成黑色”这句节奏紧凑,画面切换也要跟着快一点。我反复听了七八遍,微调画面长度,让情绪连贯。
做完之后,我自己看了好几遍。最打动我的是“篝火”那一段——柿咪咪在黑暗中面对着篝火,火光映在脸上,歌词唱到“而我依然是一个篝火者”。那一瞬间,我觉得这只小猫不只是可爱,它还有故事。
做完之后的几点感受
第一,歌词是情绪的地图。
没有歌词,我不知道该画什么。歌词把“离乡”“迷茫”“坚持”这些抽象的情绪,变成了具体的画面提示。AI只是帮我翻译,真正的导演是歌词本身。
第二,统一风格比单张好看更重要。
一组图如果色调、光影、角色比例不一致,拼在一起会很乱。花时间在“参考图”和“保持一致性”上,值得。
第三,动作指令是视频的灵魂。
同样的图,“动一下”和“缓缓回头,微风吹动毛发”出来的感觉完全不同。多写几个字,效果差很多。
第四,做MV比我想的累,但也比我想的值。
从脚本到成片,断断续续花了半天。但看到柿咪咪在画面里“演”出歌词的情绪,那种满足感,比刷半天短视频强多了。