柿咪咪已经演过不少角色:寿司师傅、像素冒险家。这周我想让它回到最日常的状态——一只普通的小猫,出门、踩水、抓娃娃、吃路边摊、雨天窝着看书。
我让AI生成了五组小片段,每组一张图片加一段几秒的动画。连起来看,就像柿咪咪的vlog。下面记录一下每个片段的生成过程。
第一张图,我想要的是那种从防盗门猫眼里往外看的效果——柿咪咪的脸被鱼眼镜头夸张放大,鼻子圆圆,眼睛大大,背景是家门口。
提示词:
“猫眼镜头视角,灰色虎斑小猫正对着镜头仰头,脸部被广角夸张放大,样子可爱,背景在家门口,卡通动漫风格,比例3:4”
生成的图里,柿咪咪的脸占了大半个画面,门框边缘有轻微的弧形畸变,很有“猫眼偷看”的感觉。唯一的问题是背景太模糊,看不出是家门口。我补了一句“身后有防盗门门框和门牌号”,第二版就清晰了。
接着做视频:
“小猫对着镜头说:我出门啦!然后关上后面的门,走出镜头”
第一次生成时,小猫说话的口型完全没动,只是张嘴闭嘴机械开合。加了“嘴巴张合幅度小,配合‘我出门啦’的节拍”,就好了。关门动作要轻,像怕吵到邻居。走出的镜头我让AI做了背影渐远。
音效我后期配了关门声和轻快脚步声。
俯拍视角,雨天湿漉漉的路面,积水里有雨圈和桂花花瓣。柿咪咪穿着奶黄色小雨衣,撑着透明小伞,左脚大步前迈,左手提雨衣下摆,小书包向后倾斜。
提示词:
“俯拍视角,雨天湿漉漉黑色路面有积水和雨圈,散落桂花花瓣,灰色虎斑小猫穿奶黄色小雨衣,撑透明小伞,奔跑中左脚向前大步迈出,左手轻提雨衣下摆,小书包向后倾斜,动漫风格,灵动温馨,比例3:4”
生成的画面,路面的倒影和雨圈很美,桂花花瓣是金黄色的。但柿咪咪的雨衣颜色太接近透明,几乎看不出。我加了“奶黄色,带小鸭帽”,第二版雨衣就显眼了。左脚迈出的动态不够明显,强调“前脚离地,后脚蹬地”,跑动感就出来了。
视频很简单:
“小猫哼着音乐,在街上行走”
哼歌的口型不用太准,但要有节奏感。我让AI生成时加了“身体随着哼歌轻轻晃动”,画面就活泼了。
卡通娃娃机场景,机器上有棕色小熊贴纸,顶上有“抓娃娃”三个字,里面很多小熊。柿咪咪在操作,抓到一只白色和棕色相间的小熊,从下面拿出来,抱在怀里贴脸。
图片提示词:
“卡通娃娃机,机身有棕色小熊贴纸,顶部写‘抓娃娃’三字,里面全是棕色小熊。灰色虎斑猫在操作,抓到一只白色棕色小熊,从出口拿出来,抱着贴脸说‘太可爱了’,美式卡通风格,比例3:4”
第一版娃娃机里的小熊太整齐,像超市货架。改成“堆叠散落,有几个压在下面”,更像真正的娃娃机。柿咪咪的爪子握着摇杆,贴脸时小熊比它的头还大,反差萌。
视频动作:
“小猫操纵摇杆,按下按钮,爪子下降抓住小熊,移动到出口,爪子松开,小猫弯腰捡起小熊,抱在怀里蹭脸”
最难的是爪子抓取的那一刻——AI把“松开”做成了“甩开”。我改成“爪子慢慢张开,小熊滑落”,效果就对了。蹭脸的动作要慢,表现出“太喜欢了”的不舍得。
美式复古卡通风格,柿咪咪坐在餐车吧台前,面前有气泡水加冰块和巧克力华夫饼。爪子搭在吧台上,眼睛亮晶晶看着老板,招牌是暖橙色霓虹灯。
提示词:
“美式复古卡通风格,灰色虎斑猫坐在复古餐车吧台前,面前一杯装满冰块的气泡水和一块淋巧克力酱的华夫饼,爪子搭在吧台,眼睛亮晶晶看着老板,餐车招牌暖橙色霓虹灯,背景傍晚街道,复古怀旧,比例2:3”
华夫饼的巧克力酱要流动感,加了“酱汁从网格边缘滴下”。柿咪咪的眼神要“渴望中带点乖巧”,配了星星眼。霓虹灯色调偏橙,写了“暖橙色发光,光晕柔和”。
视频要把静图变成动态进食:
“小猫先抓起炸鸡腿咬一口,再啃鸡排,接着叼起一个小笼包仰头吞,最后抱着一杯冰可乐用吸管喝。动作连贯,表情享受。”
我拆成了四个短动作分别生成再拼接。第一次炸鸡腿咬下去没有肉丝撕裂感,加了“咬开时露出白色鸡肉纹理”。小笼包仰头吞时汤汁溅出一点,更有食欲。
手绘卡通绘本风格,柿咪咪窝在铺针织毛毯的藤编吊椅里,抱着绘本,旁边小圆桌有热可可和草莓干,窗外飘细雨,暖黄台灯照亮圆脸。
提示词:
“手绘卡通绘本风格,灰色虎斑猫窝在铺针织毛毯的藤编吊椅中,怀抱着摊开绘本,旁边小圆桌有冒热气热可可和草莓干,窗外飘细雨,暖黄台灯照亮圆脸,温馨慵懒,比例3:4”
第
一版吊椅的藤编纹理不清晰,加了“藤条交错编织”。草莓干要有自然褶皱和红色颗粒。台灯光芒要求“从一侧照过来,另一侧有淡淡阴影”,增加立体感。
视频动作:
“小猫用前爪翻过一页书,低头认真看,又翻一页,眼睛慢慢变小,打个哈欠,脑袋一点一点往下垂,最后趴在书上闭眼睡着,身体随呼吸起伏”
翻书页的动作AI容易翻出页脚很假。我用“用爪尖挑起书角,轻轻推到另一边”,翻页就自然了。打哈欠时嘴巴要张大再慢慢闭上,眼睛迷离。最后睡着时,我让身体起伏的幅度和呼吸声稍后配上,效果催眠。
我把五个片段按时间线排列:出门→雨中漫步→抓娃娃→餐车吃饭→雨天读书睡着。转场用“渐渐变暗”(代表门关上)、“雨滴消散”(代表场景转换)、“翻书页”(自然过渡)。成片30秒左右,没有旁白,只有音效和背景乐。发出去后,朋友说“看完想养猫了”
做完之后的几点感受
第一,日常场景最难的是“自然”。
出门关门、走路哼歌、翻书打哈欠——这些动作AI容易做得刻意。关键是要慢,慢下来就像真的。
第二,美食片段不需要真实,只需要看起来好吃。
炸鸡的脆皮、小笼包的汤汁、华夫饼的巧克力酱——AI画的比真的还诱人,因为现实中很少有这么完美的光泽。