字节跳动正式进军 AI 视频生成领域,其数据、技术和人才等储备深厚。2024 年 9 月 24 日,2024 火山引擎 AI创新巡展在深圳举办,发布了两款豆包视频生成大模型——PixelDance 和 Seaweed,开启了邀测阶段。9 月 25日,视频大模型赋能的字节 C 端产品——即梦正式开启内测邀请。
1)PixelDance V1.4 是基于 DiT 结构的视频生成大模型,同时支持文生视频和图生视频,能够一次性生成长达10 秒的精彩视频片段。模型可完成时序性多拍动作,支持多主体复杂交互,还拥有丰富的运镜效果,多风格多比例兼容性强,能快速生成优质的视频片段,赋能影视创作,广告传媒,短视频,直播,电商等多个场景。
2)Seaweed 视频生成大模型基于 Transformer 架构,支持文生视频和图生视频。利用时空压缩的潜空间进行训练,模型原生支持多分辨率生成,适配横屏、竖屏,并能够根据用户输入的高清图像分辨率进行适配和保真。默认输出为 720p 分辨率、24fps、时长 5 秒,并可动态延长至 20-30 秒。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。