用工具链从到制作,创作小白必看

本文作者:郭小新,腾讯IEG产品经理

大家好,我是郭小新,是一个爱动手的大厂AI产品经理,也是一个怀揣导演梦的影视创作小白。是否你也曾想过,用自己独特的视角讲述一个故事,却止步于复杂的影视制作门槛?

如果你心中也有想讲述的故事,本篇文章为你分享一个全新的影视创作工作流:即使你没有专业的影视制作技能和经验,你也能通过AI工具链从0到1实现影视作品的创作。

作品展示

并意外地在社交媒体上获得了不错的反响,在没有任何推广的情况下,短短7天内就在抖音上获得185个赞,播放量更是突破了20000次!

制作流程

一. 工作流总览

影视MV制作的工作流具体如下,整体制作耗时约12个小时。

简单来说就是从有一个想法开始,到通过AI制作歌词,到使用AI创作音乐歌曲,最后使用AI制作视频,其中制作视频包括了:分镜脚本设计、虚拟歌手制作、MV动画制作,以及视频剪辑。

二. 歌词制作

1. 搭歌词框架

一首好听的歌曲是需要歌词框架,它分为很多不同层次的,例如前奏、副歌、主歌等。我通过与GPT协作,输出歌词制作的框架(具体如下),这样在后续的歌词及歌曲的生成质量更容易符合预期。

上图左侧是GPT提供的歌词撰写组件,右侧是我根据自己需要组合成的歌词生成框架

2. AI 生成歌词

这里我调试了几个prompt版本,最终引用了如下提示词进行歌词创作,其歌词生成的质量会更加符合预期,有需要的小伙伴欢迎自取。

## Role

你是一个专业的歌曲作词人

## Background

## Goals

改编一首儿歌《两只老虎》的歌词

## Skills

- 擅长歌词改编,不但可以保留原歌词的场景,还能进一步升华歌词,使其具有文学气质和波澜壮阔的意境

- 擅长说唱风格,具备扎实的说唱歌词的撰写技巧,例如二押、三押、连韵等技巧

## Output Format

请按以下的歌词结构输出创作内容

[instrumental intro][Verse 1]<歌词>[Chorus]<歌词>[Verse 2]<歌词>[Chorus]<歌词>[Bridge]<歌词>[Guitar solo][Chorus]<歌词>[Outro][End]

## Workflow

作为一个专业的歌曲作词人,请使用你的[Skills]并按照[Output Format]完成[Goals]

即使调优了提示词,GPT输出的第一个版本的歌词也只是更接近自己预期,关于如何进一步打磨提升歌词的质感,这里我参考了吴恩达老师的分享《AI Agent 四大设计模式》,并借鉴了四种范式中的反思机制。

即大模型生成的第一个版本,然后让大模型去分析给出优化意见,再让大模型修改一个版本,如此循环往复、迭代多轮,几轮过去输出的歌词就可以非常接近自己预期,最后人工可以做一些微调(如下图)。

三. 歌曲制作

1. AI音乐工具

我先对目前市场上3个比较火的AI音乐生成工具进行评测对比,最终选择使用Suno来生成歌曲。

评测结果:以下评测仅针对中文歌曲生成,通过提供相同歌词、相同曲风的设定,对这3个工具生成的音乐进行评测对比,其中Suno在中文的发音准确性远高于Udio、同时在音乐生成的创意和质量高于天工音乐。

Udio

Udio严重存在中文歌词吐字不准,歌词丢失情况

推荐系数:1颗星

天工Skymusic

天工在曲风设定上比较特殊,需要用户提供一首音乐进行参考,在音乐生成相对缺乏创意,同时存在篡改歌词的情况,但作为国产AI其中文发音是最清晰准确

推荐系数:3颗星

Suno

Suno 中文歌词吐字相对准确,虽电音较强,但歌曲情感也比较丰富细腻

推荐系数:4颗星

2. AI音乐生成

Suno的创作界面非常简单,具体如下

这里补充下关于如何撰写歌曲的曲风prompt,这里推荐使用的提示词结构模板如下,有需要的话欢迎自取。

<音乐流派(如Kpop、Heavy Metal)>、<音乐风格(如Slow、Broadway)>、<情绪(如悲伤、愤怒)>、<乐器(如钢琴、吉他)>、<主题或场景>、<人声描述(如愤怒的男声、忧伤的女声)>

最后一步生成音乐,Suno每次会生成3首音乐,如果不满意就调整曲风的提示词或者直接重新生成,Suno单次生成的音乐最长是2分钟左右,已经非常接近一首完整的歌曲。

四. 视频制作

1.分镜脚本设计

在开始进行MV制作之前,我依据歌词内容先对MV进行分镜设计,分镜脚本设计我认为这是一个非常重要的环节,它主要起到了3个作用:

1)提前规划内容:分镜脚本有助于提前规划MV的内容和结构,帮助思考如何更好地传达信息,确保MV可以具有清晰的叙述线索和流畅的视觉效果;

2)节省时间和资源:通过设计分镜脚本,可以事先决定哪些场景需要虚拟歌手,哪些场景需要AI生成画面及动画,从而在实际制作过程中大大节省时间和资源(毕竟AI制作的单位内容都是有成本的);

3)发挥灵感和创意:在设计分镜脚本的过程中,可以尝试不同的讲述方式来呈现MV内容,这个阶段由于主要是花时间找参考、寻灵感、反复构思、不断梳理,并没有实际的制作限制,所以可以自由的想象场景和效果;

上图是我制作MV所设计的分镜脚本

我坚信,未来使用AI进行影视创作的艺术家,只需专注于分镜脚本设计去提供1%的灵感,剩下99%的汗水让AI来做。

2.虚拟歌手生成

目前市场上有3个口碑比较不错的AI工具,即通过人物照片来生成对口型的视频(目前主要用于演说场景),我尝试在演唱场景下对比其生成效果,最终我选择使用Heygen。

评测结果:以下评测仅针对演唱场景的生成效果,通过提供相同歌词、相同照片的设定,对这3个工具生成的视频进行评测对比,其中Heygen在口型匹配度上相对准确些 ,同时生成的人物动画效果也更加自然一些。

Heygen

口型匹配度:中偏上

动画效果:中

免费体验额度:2min

推荐系数:4颗星

奇妙元

口型匹配度:中

动画效果:中偏下

免费体验额度:1min

推荐系数:3颗星

DID

口型匹配度:下

动画效果:中

免费体验额度:2min

推荐系数:2颗星

如上都是收费工具,但均有一定的免费体验额度,另外也有一些对口型的开源工具,其中SadTalker(基于Stable Difffusion)生成的对口型视频效果应该是目前开源最强的(如下图)。

3. AI生图

MV的歌手形象以及场景画面的生成,我选择使用Midjourney。

原因比较简单:我想要的MV质感和审美,只有Midjourney可以做出来。

1)与GPT协同撰写

将对应的歌词丢入到GPT中,让GPT先理解歌词,然后让他去想象歌词所描绘的画面,并给出具体的文字描述及Midjourney的提示词,最后通过Midjourney去生成图片。(如下图案例)

2)小红书找灵感

我寻找提示词的灵感一般是在小红书,当然也有垂直社区专门分享AIGC的图片和提示词,如:ArtStation、CivitAI、Liblib。

有时遇到喜欢的图片风格,博主却没有分享提示词,一般这个时候我会把图片保存下来,然后通过chatgpt分析图片获得图片描述信息,再结合Midjourney的Sref指令,如下图案例,基本可以还原自己喜欢的图片风格。(具体如何使用,详细可见网友的MJ V6 Sref的使用技巧 )

一般生成视频的场景图片,除了需要风格一致性,有时还需保持角色一致性,这里推荐使用Midjourney的Cref的指令,如下图案例,我生成了一个橘色长发、身穿水手服的女孩,然后使用Cref指令生成后续的图片,可以发现女孩无论是外表还是服装基本可以和原图保持一致。(具体如何使用,详细可见网友的MJ V6 Cref的使用技巧 )

4. AI图生动画

这是整个制作中最为耗时的环节,整个MV制作耗时约12个小时,其中AI图生动画的环节耗时占50%。

为保证视频画面的风格一致性,此环节主要是采用了图生动画的方式,由于现有图生动画的时长短、可控性弱,需要较强依赖不断的抽卡,因此非常耗时!

在Sora没出来之前,我们能玩的只能是4s。在4s时代,我目前用的最多的是Runway,其次是Dreamina、Pika、Pixverse,4个工具中Runway在本MV视频制作占比达到80%。

1)可控性:工具提供的功能和选项,允许用户对视频内容进行精细调整;

2)细节保留度:在视频生成过程中,对原始素材细节的保持能力;

3)运动处理能力:工具处理视频运动和过渡时的流畅性和自然度;

Runway在如上的评估标准,表现出色的主要是在可控性以及细节保留度:

1)可控性:用户通过镜头控制和运动笔刷功能,能够实现对视频的细节进行较简单的调整;

2)细节保留度:在视频生成过程中,Runway对原始图片的细节能进行较出色的保留,从而保证图片到动画的还原;

3)运动处理:Runway在做一些小幅度的特定运动轨迹以及运镜,可以较好的处理运动的流畅性和自然度,但是在大幅度运动,Runway明显存在局限;

例如,这只抬头望向阳光的老虎,只需使用Runway的运动笔刷就能很快刷出来。而使用其他工具,无论如何调整提示词,都无法达到这样的效果,相比之下,Runway的可控性确实更强!

其他像一些小幅度的运镜、多对象的不同运动路径,其生成效果也是非常不错的

一张图片想要生成比较不错的动画效果,目前是少不了人工不断修改提示词、修改笔刷路径,反复不断的Roll,基本每张图片至少需要Roll个7-8次,这也是这个环节为啥非常耗时的原因。

Runway在生成小幅度的运动确实不错,但是让它生成一个物体大幅度的运动动画,它现在只能直接躺平。

例如,两只老虎在雪林奔跑的场景,我Roll了至少10次以上,无论怎么修改提示词和笔刷的运动轨迹,都是出不来效果。

而字节的Dreamina在大运动幅度这块,确实让我有些惊讶,同样在Dreamina去Roll上面这个画面,只是Roll了2次就能出来比较不错的效果。

当然Dreamina也有2个局限:

1)运动幅度过大,导致极难控制;

2)对特定风格的原始素材在细节保留还存在一定局限(尤其是动漫风格);

例如,一只身上带着蓝色火焰的老虎在河道行走,无论我如何调整提示词,在Dreamina生成的视频很难保留原始素材的白虎形象及火焰特效;

5. 视频剪辑

这是最后一个环节,在音效和剪辑上,这里都是人工操作。

但是胜在剪映是个好工具,所以这个环节完成的特别快,基本只需要1个小时左右。

以上,就是我使用AI工具链从0到1制作影视MV的全流程,希望能对你有所启发。

总结

写到最后,我坚信,AI始终只是工具,它可以大大降低人类创作的门槛,但无法替代你在创作过程中涌现的灵感与创造力!

另外无论你是哪种形式的创作,无论使用的是AI还是非AI的工具,工具的本质都是为了方便人类更高效的创作。因此,不用拘泥于特定的工具包括AI,而是在成本与效益间去寻找最优解。

THE END
0.爆赞!8款国内即可使用的AI视频生成工具惊艳!这张61年前的老照片,我们用AI技术“复活”了 多说一句,目前爆火的AI老照片修复,很大程度上与可灵非常惊艳的AI视频效果有关。 主要特点: 文生视频:支持输入正反向提示词、支持生成5秒和10秒视频、支持运镜控制 图生视频:可对图片进行创意描述、增加尾帧功能、可输入负面提示词、支持生成5秒和10秒视频、支jvzq<84yyy4489iqe0ipo8hqpvkov87612=2685213=8:9:28a724A<2;9:70|mvon
1.一次学会,AI摄影+AI短视频+AI音乐创作❷ 第二步:一键生成动态旋律 AI直接生成带主旋律的音乐片段! 和弦走向、节奏变化全自动生成,AI直接给你整出电影级配乐! ❸ 第三步:AI自动生成音乐MV 用AI根据歌词或音乐风格来生成MV视频,或者将照片丢给AI,让它自动剪辑视频、识别歌词字幕,将零散画面串联成叙事线。 jvzq<84yyy4489iqe0ipo8hqpvkov87712:2:86319817?59;a727:9;;7:50|mvon
2.Ai一键成曲手机免费版软件下载Ai一键成曲是一款AI音乐创作工具,无需专业音乐知识即可快速生成原创音乐与MV,通过简单的文字描述如风格主题等,就能自动生成包含旋律编曲的完整作品,并提供歌词辅助和MV制作功能,软件内置多风格模板、支持实时预览调整及高效创作流程,是音乐爱好者和自媒体创作者的理想选择。 jvzquC41yy}/4A>0eqs0cƒwl17:85>80jvsm
3.文生3D模型大突破!MVDream重磅来袭,一句话生成超逼真三维模型图像图片来源:由无界 AI生成 不得了了! 现在只用打几个字就能创造精美、高质量的3D模型出来了? 这不,国外一篇博客引爆网络,把一个叫MVDream的东西摆到了我们面前。 用户只需要寥寥数语,就可以创造出一个栩栩如生的3D模型。 而且和之前不同的是,MVDream看起来是真的「懂」物理。 jvzq<84hkpgoen3ukpg/exr0ep5cnxhmejgjp872453226621fud/rr|stgvrB>73:;20|mvon
4.我用豆包,生成了AI版《红楼梦》MV要论最近最火的AI视频生成模型,无不论是生成的多人物、画面的质量,甚至是故事情节,豆包的视频可以说是相当有《红楼梦》那味儿了。 而也正如刚才提到的,打造这支MV背后的AI,统统都是字节系。 现在我们就来一一拆解细节步骤。 第一步,用豆包查询《红楼梦》中的经典片段原文,作为生成图片的Prompt。 jvzquC41zwkrk~3eqo522B<86;97488298<17B7
5.AI音乐半年观(上)音乐生成有哪些实用场景和代表产品?我将AI音乐生成的实际应用归纳为5个场景,生成技术在音乐视频和功能型音乐创作中正在发挥商业价值,社交娱乐和业余音乐创作场景未产生明确价值,专业创作领域尚待AI融合进工作流。 01 音乐视频 做一支属于你的MV AI 音乐生成的第一个应用场景是搭配 AI 图片和视频生成工具,制作音乐视频(MV,Music Video),正在被用于商业jvzquC41uuvbk7hqo1vpu}4;4696
6.免费一键生成「大片」,又一王炸AI工具上线这个AI 工具,可以通过文本和图片自动生成 4 秒的视频,同时内容相当炸裂。 口说无凭,大家可以先来品品这个用 Runway Gen-2 生成的视频,看完导演跟特效小哥是不是都得去送外卖了? 不过别人做得再好也是别的,自己上手完全不是一回事的话,那真没啥好吹的。 jvzquC4158qs0lto1r535:538;67:?64:8:
7.ai图片生成视频ai图片生成高清原创视频下载新片场社区汇聚全球优秀创作人和海量作品精选出1000条ai图片生成等4K原创短视频,覆盖ai图片生成相关的广告,宣传片,剧情短片,创意混剪,婚礼,纪录片,特殊摄影,旅拍,Vlog,影视干货教程,音乐MV等ai图片生成无水印高清视频案例学习下载jvzquC41yy}/zrsrkctdjjsi0eun1|jcten03=6479=
8.围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创目前支持文本、图片生曲,但不包括视频输入。 相比之下,拥有海量版权的在线音乐巨头则审慎得多。针对创作者,网易云音乐和腾讯音乐分别推出了具备 AI 辅助创作功能的「天音」和「启明星」平台。 「天音」更适合专业创作者,在「一键生成」上并没展现出领先其他 AI 生成应用的优势。「启明星」接入了「琴乐大模型」,仍jvzquC41yy}/3?80eqs0f‚4ctvodnn4LMDU4:J92737BSQT0jvsm
9.第一批用AI替自己干活的人:一个人顶一个团队|ai|贝聿铭|扎哈·哈迪德用建筑AI软件一键导出的大师风格效果图 贝聿铭大师风格(左)和扎哈·哈迪德大师风格(右) 用建筑AI软件一键导出的 建筑大师弗兰克·盖里风格效果图 与此同时, AI制图软件Midjourney 也在中国社交平台火了一把, 摄影师用它复原20世纪老照片, 设计师直接用它出图。还有建筑行业的AI,可以一键生成大师风格的效果图…… jvzquC41yy}/3?80eqs0f‚4ctvodnn4K56JNTNP274;94KG0jvsm
10.用AI制作歌曲MV!超详细教程,快速上手,收藏必看!5.导出成片 编辑完成后,点击【导出】按钮生成最终MV。 通过ChatGPT生成画面描述、即梦AI制作图片与视频,再用剪映剪辑成片,你可以轻松完成一部高质量的歌曲MV!无论是创作者还是初学者,这套方法都简单易上手。 赶紧试试,为你喜欢的歌曲制作专属MV吧!jvzq<84yyy4489iqe0ipo8hqpvkov8771273886519:65B=2a3757<<43;8/uqyon
11.用AI做自己喜欢的MV(Suno保姆级教程)一致性方面,可以使用图片 ID 和 Seed 值 如果没有 GPT 4,可以使用 Midjourney V6提示词结构:风格+主题+背景+构图+灯光+附加信息 五、用图片在 Pika 1.0 生成动画视频 六、用剪映合成视频 最后案例的这个 MV 视频,主题是 AI破局航海,灵感来源是目前正在举行的第三期 AI 破局俱乐部大航海。 jvzq<84yyy4489iqe0ipo8hqpvkov8761283886516965>=56a723>7492910|mvon
12.星火绘镜官网,ai生成视频,将文字描述自动转化为视频内容该应用涵盖了从生成剧本、分镜头设计到最终形成完整的视频短片的全过程。它特别适合于内容创作者和市场营销人员,因为它可以快速地将创意或故事以视频的形式呈现,简化了视频的制作流程。星火绘镜,AI视频创作平台。分镜自动拆分,画面一键生成。支持短剧、MV、预告片多题材。描述及创作,短视频轻松生成。jvzquC41hgo{j~pg0eun1|nvgu5ykwljwqnvksnpi0nuou
13.MOKI官网,AI视频短片创作工具,备智能剪辑、自动生成分镜图、AI–**AI短片创作**:支持动画短片、网文短剧、故事绘本和MV等多种视频类型,提供创意构思辅助。 –**AI生成分镜图**:自动生成分镜图并转换为视频素材。 –**AI智能剪辑**:自动识别视频关键帧,进行智能剪辑,提高编辑效率。 –**AI配乐**:根据视频内容自动添加契合的背景音乐。 –**AI音效**:自动添加环境或特定jvzquC41dkknq‚z0eqs0urygu1spmr3jvor
14.ai自动生成视频软件下载免费ai自动生成视频手机端ai自动生成视频软件是可以帮助我们自动生成各种短视频和长视频的工具,直接让我们的视频导入之后就可以自动的进行剪辑生成,或者是直接套用模板,快捷的解决剪辑问题,ai自动生成视频手机端可以直接一键生成,减少用户的剪辑视频时间,减少工作量,还可以分享给自己的好友,很多用户想要知道ai自动生成视频软件有哪些,下面就让小编给jvzq<84yyy4eq€see0ipo8p1ck€jfxsiujkoilmgpiyikynp1
15.最全合集!20个AI视频生成产品推荐&实战教程!优设网本篇通过产品介绍和丰富的案例实践,带你了解 AI 视频有哪些产品,效果如何实现。产品概况若从生成方式分类,AI 视频生成包含:文生视频、图生视频(Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、StabilijvzquC41yy}/wrxfe0ipo8fkie3wkmjq/4
16.EchoAI一键成曲app下载EchoAI一键成曲官方版下载v1.0.0EchoAI一键成曲是一款智能便捷的手机ai音乐创作软件,在软件中可以创作不同风格的音乐作品,不仅能够智能创作生成,还拥有智能翻唱,个人mv生成功能,喜欢就快来下载体验吧! 【软件特色】 一句话成歌:输入一句话/几句话,自动生成歌词、旋律与编配。 大师模式:细调风格、情绪、BPM、押韵、段落长度,版本对比一键切换。 jvzq<84yyy467@<0eqs0u8<383690qyon
17.大量AI生成音乐诞生,音乐行业正在一夜变天|钛媒体AGI杨樾,图片由其本人提供 3月23日凌晨3点多,一支全部由AI制作的MV出现了。 那一刻,作为这支作品的创作者,杨樾感到既兴奋,又幻灭。 这是这位坚定的AI爱好者,用AI做的一次极限尝试。Digital Dawn的歌词是ChatGPT写的,作曲编曲演奏演唱是Suno生成的,底图是用Midjourney画的,视频是用Kaiber生成的。 作为一个从1988年就jvzquC41yy}/vvyrquz/exr1dcoew8<229=927mvon
18.视频生成神器!口型自然,不限语言,多用途,一键生成对口型视频!数字人从此我也是MV音乐达人,【火爆全网的】AI视频生成神器!口型自然,不限语言,多用途,一键生成对口型视频!数字人说话工具Wav2Lip离线版。 1.下载方式:【123网盘下载】、【网盘下载】 Wav2Lip是一种数字人说话工具,主要用于实现视频人物的唇形同步。它可以根据输入的音频,在视频人物的口部生成与语音同步的唇形动画,使得生jvzquC41dnuh0lxfp0tfv8z23698695;1cxuklqg1fkucrqu13975<>995
19.AI生成人物AI智能人物照片生成AI生成人物图片,智能人物图片生成软件,支持二次元、写实、3D等各类风格人物图片生成,输入人物描述词,选择人物风格和尺寸即刻生成精美人物图片。体验AI人物生成 选择模板 讲师海报 宣传展架 小红书封面 视频封面图 照片拼图 十余种人物图片设计场景,海报/展架/封面图应有尽有 讲师海报 英语专八课程宣传海报 课程直播预告简约风手机 jvzquC41yy}/eqzcpiqjv7hqo1geny7148;/j}rn
20.刚刚,Sora官方发布首支MV这并非是August Kamp第一次用AIGC技术来制作MV。 早在上个月,他就在自己的Instagram账号中剧透了AI生成的MV片段: 同样的,这支MV片段的每一帧画面,都是由Sora生成。 很多网友们在看到Sora制作出来的MV之后可谓是感慨万千,有人评价道: Sora好像把一觉睡了300年所经历的梦给复刻出来了。 jvzquC41jwh/djfk0ci/ew4xkg}05?783