干翻ora!百度蒸汽机实时流式生成,把生视频玩出花儿长视频sora知名企业

【TechWeb】10月15日,百度搜索全面升级了文心助手的AIGC创作能力,可支持AI图片、AI视频、AI音乐、AI播客等8种模态创作,且能够一键调用多工具解决多场景问题。

尤其值得一提的是文心助手提供行业领先的长视频生成玩法。输入一段话,即可创作一部 3 分钟的故事大片。而这一能力,得益于视频生成模型百度蒸汽机的再次升级支持。

百度蒸汽机模型自今年5月闯入AI生视频赛道就拿下VBench-I2V全球榜一。

此次百度蒸汽机模型突破传统AI视频生成10秒左右的时长限制,还在行业首次实现AI长视频“实时交互”生成,也就是过程可打断、可编辑,而且生成速度超越国内主流视频生成模型。

目前,每天有千万量级的AIGC内容由用户通过文心助手创作产生。

在接受媒体采访时,百度副总裁、百度搜索总经理赵世奇和百度副总裁、移动生态商业体系负责人陈一凡不约而同的都提到,Sora 2带来启发,随着百度大模型技术的进化,结合大模型的能力,在产品侧,要让AI生视频、AIGC的使用门槛更低、用户玩法更丰富。

此次百度搜索&蒸汽机模型,让AI生视频的体验迈上新台阶。

AI生视频全新交互体验:可任意编辑、控制剧情走向

作为AI生视频背后能力支撑,此次升级后的蒸汽机模型有几大突破:

1、仅上传一张图片和一段提示词就可生成一段长视频。支持长视频流式生成,突破了市面上(包括Sora2),AI生视频工具5s-10s的时长限制,可生成任意时长视频。

2、支持实时交互,也就是用户在生成视频的过程中,可随时打断、任意修改提示词需求,来调整生成的视频内容。这意味着,用户在生成过程中可随时暂停,并基于已生成的画面提交新的Prompt(提示词)来引导后续剧情发展。这极大的方便了视频创作。

据介绍,蒸汽机模型能力支持无限时长生成,产品层面考虑用户应用场景会做一定时长限制。目前,对创意视频时长会限制在1分钟。

现场,百度商业体系商业研发总经理刘林演示了用蒸汽机模型生成沙漠赛车视频时,根据用户不同需求,实现实时生成不同比赛结果(银色车胜出,还是黄色车胜出)的视频效果。

引来现场阵阵掌声。

蒸汽机模型这种具备交互能力的长视频生成技术重塑了人机互动模式,有望推动内容消费方式由“被动接收”向“共同创造”转变,甚至催生新型艺术形式与商业生态。

陈一凡介绍,目前蒸汽机的长视频生成能力已经受到营销圈、娱乐化用户的青睐。

背后技术突破

百度商业研发首席架构师李双龙介绍,此次蒸汽机模型升级的解法与思考是从分治到全局,引入自回归扩散模型(Autoregressive Diffusion Models),同时结合自回归的长序列能力和扩散一致性强的优点,进行优化。

通过引入自回归扩散模型,采用基于流式滑窗的自回归扩散架构,以此来实现低成本无限外推和实时生成。长视频生成过程为流式体验,模型推理出多少,用户即可实时预览多少,无需等待全部生成完成。采用全局规划与局部参考相结合的优化方法,解决生成长视频时的连续性与一致性问题。

同时依托商业强大的工程优化能力,对模型进行极致压缩,优化主要包括模型参数压缩(大模型蒸馏小模型)、window attention降低attention过程中可见序列长度、步数和CFG蒸馏等策略,不断降低推理耗时,最终实现几乎实时性效果。

AI视频生成领域正处在一个技术快速迭代、应用场景不断拓展的关键阶段。

目前,蒸汽机模型还支持生成实时交互数字人,告别以往单向输出的数字人视频模式,支持沉浸式互动,做用户专属的数字人。可拓展AI导购、AI老师、AI陪伴等沉浸式数字人场景。

另外,蒸汽机模型支持开放世界生成,无论是游戏地图、旅游景点体验、还是宇宙空间,都可以任意生成、任意探索,任意创造。

“把AI生视频的门槛降低,就会有更多玩法融入”,刘林表示,AI生成视频打破了长度的限制之后,进一步降低了视频创作门槛,能生成更完整更优质的内容,助力创作者的生产和变现。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.《百度视频生成模型蒸汽机上线手机网页版,8月将行业首发多人有声7月22日,百度商业自研的AIGC视频生成模型蒸汽机正式上线手机网页版,支持用户通过移动端一键生成电影级视频。据悉,该模型自上线2周,注册用户量突破30万,单小时任务提交量达18,000次,累计生成内容超200万条。 此外,当前 Turbo版限时免费公测中,8月还将上线Lite/Pro及全系列有声版本,实现行业首次支持单人人声、双人对jvzq<84dk|4jhnsi0eun1l4:nF{L9_Z4I
1.百度视频生成模型蒸汽机上线手机网页版36氪获悉,7月22日,百度商业自研的AIGC视频生成模型蒸汽机正式上线手机网页版,支持用户通过移动端一键生成电影级视频。据了解,该模型自上线2周,注册用户量突破30万,单小时任务提交量达18000次,累计生成内容超200万条。此外,当前Turbo版限时免费公测中,8月还将上线Lite/Pro及全系列有声版本,实现行业首次支持单人人声、双人对话视频生成。该模型基于亿级中文多模态数据训练,采用多jvzquC4158qs0lto1pkxuoqcujkt1<8:;9?4:@6963668
2.百度蒸汽机视频生成大模型升级2.0版本,定价低至行业70%百度蒸汽机视频生成大模型升级2.0版本,定价低至行业70% 8月21日,百度旗下视频生成大模型—“蒸汽机”发布最新版本,在行业内首次实现多人有声视频一体化生成。据记者了解,该系列大模型已经在百度搜索、营销等多个场景落地应用,定价低至行业70%。 责任编辑: 郑灶金 百度 视频生成大模型 蒸汽机jvzquC41yy}/u}hp0eun1jwvkerf1mjvckr05;745;:/j}rn
3.百度大涨,AIGC视频生成模型蒸汽机将会给百度带来什么?百度7月23日盘中表现强势,盘中一度涨4.49%。消息面上,百度旗下百度商业研发团队自研的AIGC视频生成模型蒸汽机(MuseSteamer)正式上线手机网页版,支持用户通过移动端一键生成电影级视频。百度的大涨我们该怎么分析? 首先,百度股价的上涨反映了市场对其新推出的AIGC视频生成模型蒸汽机的高度认可和期待。这款模型能够支持jvzquC41yy}/rltpnktf0lto0et0cr4ctvodnn4356637>3jvor
4.百度MuseSteamer视频生成模型开放H5体验电影级创作触手可及7月22日,百度商业宣布正式开放自研视频生成模型"MuseSteamer蒸汽机"的H5体验入口,让普通用户也能通过手机端体验AI电影级视频创作。这一举措标志着百度在生成式AI领域的又一重要落地应用。 打开网易新闻 查看精彩图片 早在7月2日的百度AI Day上,百度商业研发团队就重磅推出了MuseSteamer及配套创作平台"绘想"。该模型jvzquC41o07757hqo1jz1jwvkerf1T:5;:ZWR9:78C_Q\7mvon
5.从百万预算到几分钟成片:百度蒸汽机为品牌视频开了挂8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,在行业内首次实现多人有声音视频一体化生成。创作者输入脚本,几分钟后你就能收获一条有角色、有对白、有情感、有镜头语言的视频成片。更重要的是,它不是实验室里的“炫技模型”,而是已经在一汽-大众、伊利倍畅等品牌的真实营销案例中落地,帮他们把原本jvzquC41zwkrk~3eqo525;;253<13886;38:4:5
6.百度蒸汽机视频模型升级2.0版本实现多人有声视频一体化生成8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型宣布完成升级,业内首次实现多人有声视频一体化生成。其Turbo版、Lite版、Pro版及全系有声版全面开放,用户可通过百度搜索或登录相关平台体验。 据悉,百度蒸汽机是全球首个中文音视频一体化生成的I2V模型,首创多模态潜在空间规划技术,能够自主协调多角色身份、情感与jvzquC41i0vdqwqkpg4dqv3ep1~03B;813?78?5;40nuou
7.视频生成模型百度蒸汽机推出可实时交互长视频功能钛媒体App 10月15日消息,视频生成模型百度蒸汽机(文心专精)宣布升级,行业首次实现AI长视频实时交互生成。该功能升级依托流式视频技术实现“无限时长”生成,突破传统AI视频生成10秒左右的时长限制,生成速度超越主流中国视频生成模型。据悉,用户只需上传单张图片与一段jvzquC41o0znvytuv0ipo8skevgukxs199834@>0jvsm
8.百度蒸汽机,盯上长视频生成实时交互近期,Open AI发布最新多模态视频生成模型Sora 2,国内一众AI视频玩家,亦频频更新动态。 10月15日,百度旗下视频生成模型,百度蒸汽机(文心专精)再次升级,这一次的重点,放在了交互体验上。 百度称,蒸汽机模型实现实时交互生成AI长视频,突破传统10秒左右的时长限制。 jvzquC41yy}/4:okpipj0lto1cxuklqg14637:5391nftjqf16i429>4d7h47m5675g4h>;e39=e:lk540nuou
9.百度蒸汽机突破AI视频5秒限制,全球首发无限长视频生成功能【#百度蒸汽机打破AI视频5秒魔咒#长视频生成能力率先上线】9月25日,全球首个中文音视频一体化视频生成模型百度蒸汽机升级,发布通用AI长视频生成功能,支持用户生成无限长度的AI视频,本次升级在行业尚属首次,突破了此前AI仅能生成5秒、10秒短视频,或依赖首尾帧控制续写时长的局限,采用流式生成技术实现在通用长视频上的“无限”生成能力, jvzquC41ecogwqfq0ggtvvtpg{4dqv4pgyy049772;872:9548=15=82396
10.行业首次百度蒸汽机实现AI长视频实时交互【行业首次 百度蒸汽机实现AI长视频实时交互】财联社10月15日电,百度宣布视频生成模型百度蒸汽机(文心专精)再次升级。该模型突破传统AI视频生成10秒左右的时长限制,行业首次实现AI长视频实时交互生成,生成速度超越国内主流视频生成模型。据悉,用户只需上传单张图片与一段提示词即可启动视频生成流程,并能实时预览模型推理jvzquC41hktbplj0khkoi7hqo1i0:wYWQ6g{y:7
11.百度蒸汽机视频模型升级2.0版本,宣布价格低至行业70%产品经理决策点:与架构师紧密沟通,明确系统设计是优先支持横向扩展还是纵向扩展。这直接影响初期采购/租赁策略(买大机器vs买多小机器)和长期成本模型。 三、服务器配置 服务器配置(CPU、内存、存储、网络)是性能的基石,也是成本的大头。产品经理需在满足性能需求、控制预算、预留未来扩展空间三者间找到最佳平衡点。 jvzq<84nkw€iq~3|jgth|qtwujkoiof0eqs0ulfng17:7980ujznn
12.百度视频生成模型MuseSteamer开放H5体验入口【TechWeb】7月22日消息,百度商业自研的 MuseSteamer 蒸汽机正式开放 H5 体验入口(https://huixiang.baidu.com/mobile)。 在7月2日的百度AI Day开放日上,百度商业研发团队自研的视频生成模型“MuseSteamer”及创作平台“绘想”重磅推出,直接把AI视频创作拉入电影级水准。用户仅需上传1张图片,MuseSteamer即可生成10jvzquC41yy}/vnhjygh/exr0ep5ve€jd1pkxu8nf14?75>;7
13.百度蒸汽机2.0发布:成本降至七成,AIGC视频将进入普惠时代AI视频生成正成为大模型竞争的核心战场,成本与质量的平衡逐渐成为行业比拼的关键。 8月21日,百度在“热AI大会”上发布蒸汽机2.0,Turbo、Lite、Pro及有声版同步上线。新版本在语音与画面同步、多角色对话生成、中文场景适配等方面进行了升级,并将定价大幅下调,刊例价相比同类产品下降至70%,让好莱坞百万级特效成本降至jvzquC41uvudm762lsqb0lto0et049772:841l;927?5;:70ujznn
14.百度辟谣蒸汽机视频生成模型多个海外仿冒网址百度营销发布官方声明,表示近期海外出现大量关于视频生成模型——百度蒸汽机(MuseSteamer)的虚假网站,紧急提示用户注意甄别,谨防受骗。声明同时提到,百度蒸汽机(MuseSteamer)自上线以来受到各方关注,将于8月21日举办升级发布会,全新推出百度蒸汽机 2.0 版本,包括Turbo、Lite、Pro和有声版全系模型。jvzquC41o0jejn0eqs0pn|u13639A69624ivvq
15.百度蒸汽机视频模型升级2.0版本,宣布价格低至行业70%B站不同于其他视频平台,当年想要成为注册会员可是要经过“入学考试”的,100道题目难度不小,当年的老二次元们很多都是一边搜索一边答题的。现在B站的题目虽然没那么难了,但是对于60后来说,弹幕礼仪、二次元文化等相关内容,想要拿到高分依然不简单。 魏建军也分享了自己B站考试的内容,自己答错的题目也十分坦诚地公布了jvzq<84zkcthvjs0ufqvcrxqw0io1zzknv572:<:7;4tj}rn
16.百度蒸汽机视频模型升级2.0版本,宣布价格低至行业70%利用Transformer网络对输入的不完整点云数据进行补全。这一过程通常包括将预处理后的点云数据输入到Transformer网络中,经过一系列的Transformer层进行特征提取和重建。最终,模型会生成完整的点云数据,填补了原始数据中的缺失部分。 在计算机视觉领域中,微云全息提出的一种基于TNet的增强型点云补全方法,标志着对于处 jvzq<84{cct/umpwckypw7hp1|uocu4424;238<5:6>567xjvor
17.对话百度蒸汽机团队:国内视频生成模型赛道非常“卷”,Sora2发布后团队都10月1日,OpenAI 推出新一代视频生成大模型 Sora2,凭借10秒有声一体化视频及社交化玩法迅速引爆网络,不仅让用户可对生成内容进行分享、点赞、评论,形成病毒式传播,更直接加剧了国内视频模型赛道的技术竞赛压力。 面对Sora2的“破圈”,国内的视频生成模型团队迅速响应。近期,百度蒸汽机团队在接受《中国经营报》等媒体jvzq<84yyy4dd7hqo0io1rsfgz5tjx|1|l5dx8hx35;44@6434<3
18.百度蒸汽机推出可实时交互长视频功能,支持打断改写续写10月15日,百度视频生成模型蒸汽机(文心专精)再次升级,实现了AI长视频实时交互生成。 该功能升级依托流式视频技术实现“无限时长”生成,突破传统AI视频生成10秒左右的时长限制,生成速度超越国内主流视频生成模型。 在百度蒸汽机中,用户只需上传单张图片与一段提示词即可启动视频生成流程,并能实时预览模型推理全部内容。jvzq<84yyy4dd7hqo0io1rsfgz5tjx|1iu70e4ex3866=<;3392
19.百度蒸汽机视频生成大模型升级2.0版本,定价低至行业70%百度蒸汽机视频生成大模型升级2.0版本,定价低至行业70% 人民财讯8月21日电,8月21日,百度旗下视频生成大模型—“蒸汽机”发布最新版本,在行业内首次实现多人有声视频一体化生成。据记者了解,该系列大模型已经在百度搜索、营销等多个场景落地应用,定价低至行业70%。 海量资讯、精准解读,尽在新浪财经APPjvzq<84hkpgoen3ukpg/exr0ep5kl|14286/9=/435eql2kphsutk666686@3ujvsm
20.视频生成模型大幅降价,百度为何如此激进?蒸汽机新浪财经百度旗下的视频生成模型蒸汽机完成了一次大幅度升级,这距离该模型上线仅仅有50天。 在模型能力上,蒸汽机模型最大的变化是实现了多人有声音视频一体化生成,模型生成的视频不需要再进行后期配音,人物的声音和表情、动作以及嘴型实现同步,即使在复杂场景下也能够保持稳定。同时,生成视频的画面清晰度和流畅度也有了明显提jvzq<84hkpgoen3ukpg/exr0ep5tvxhm1v532;:/2:3358iqe/oohv}vrh:3;?;:40yivvq