摘要:前两天翻硬盘,翻出一早就存好的《肖申克的救赎》片段——不是全片,是零散截的十几个镜头,最长47秒,最短8秒,全塞在D盘一个叫“D:\coze\video-use\肖申克的救赎”的文件夹里。当时随手一放,没想到真用上了。我对着WorkBuddy说:“用这些素材,
前两天翻硬盘,翻出一早就存好的《肖申克的救赎》片段——不是全片,是零散截的十几个镜头,最长47秒,最短8秒,全塞在D盘一个叫“D:\coze\video-use\肖申克的救赎”的文件夹里。当时随手一放,没想到真用上了。我对着WorkBuddy说:“用这些素材,按瑞德(Red)第一人称视角,讲安迪(Andy)在肖申克怎么活下来的。”它没问“您确定吗”,也没弹窗要我点确认,直接黑屏两秒,开始读文件夹。
它先报了总时长:2分38秒。又甩出一段摘要:“片段含2处铁门关闭音效、4段牢房走廊环境声、3次安迪低头微笑特写(帧率24)、瑞德画外音原始录音共11段,最长单句12.6秒,含‘嗯’‘啊’‘那个…’共21处。”我愣了下——它连“那个…”都数清了,比我自己还较真。
接着弹出剪辑草案:开头用安迪爬出下水道那场雨的慢镜,叠瑞德旁白“有些鸟不该关在笼子里”,中间插三段狱中沉默的蒙太奇,结尾停在安迪撕掉海报露出隧道的瞬间,字幕用粗衬线体,配色偏青灰。我顺手勾了“加字幕”“1080p”“总长控制在3分钟内”,它就闷头开工去了。ffmpeg跑起来,ElevenLabs的转录脚本自动调用,音频转文本后,模型一边读文字稿,一边按需抽了67帧画面图——但它真没“看”视频,全是听+查,所以全程没卡,我泡杯茶回来,预览版“editpreview.mp4”已经躺在文件夹里了。
初版有点愣:镜头切得像打拍子,安迪递石锤那场戏,上一秒还在牢房,下一秒直跳到操场,声音还没落呢画面就跳了。我说:“转场软一点。”它秒回:“已加交叉溶解+音频淡入淡出,淡出时长从30秒微调至2.8秒(匹配原声气口)。”再打开,雨声是慢慢渗进来的,牢房铁门“哐当”声拖了半拍才收住——人味儿一下就回来了。
对了,它记所有中间状态。我中途切去回微信,回来它还在“D:\coze\video-use\肖申克的救赎”底下留着json日志,连我上次嫌字幕字号小、手动调过1.2倍都存着。ElevenLabs的API密钥是前晚注册时填的,官网开发者页点“Create API Key”就出来一串字符,黏贴过去,它立刻认出是带voice-cloning权限的旧key,没让我重配。
现在那个mp4我发给了三个朋友看。没人信是我剪的。
来源:科技百晓说