字节豆包视频大模型-主打时序性复杂动作指令和交互能力 - 产业资讯 - 行业新闻

字节豆包视频大模型-主打时序性复杂动作指令和交互能力
思瀚产业研究院 2024-10-19

字节跳动正式进军 AI 视频生成领域，其数据、技术和人才等储备深厚。2024 年 9 月 24 日，2024 火山引擎 AI创新巡展在深圳举办，发布了两款豆包视频生成大模型——PixelDance 和 Seaweed，开启了邀测阶段。9 月 25日，视频大模型赋能的字节 C 端产品——即梦正式开启内测邀请。

1）PixelDance V1.4 是基于 DiT 结构的视频生成大模型，同时支持文生视频和图生视频，能够一次性生成长达10 秒的精彩视频片段。模型可完成时序性多拍动作，支持多主体复杂交互，还拥有丰富的运镜效果，多风格多比例兼容性强，能快速生成优质的视频片段，赋能影视创作，广告传媒，短视频，直播，电商等多个场景。

2）Seaweed 视频生成大模型基于 Transformer 架构，支持文生视频和图生视频。利用时空压缩的潜空间进行训练，模型原生支持多分辨率生成，适配横屏、竖屏，并能够根据用户输入的高清图像分辨率进行适配和保真。默认输出为 720p 分辨率、24fps、时长 5 秒，并可动态延长至 20-30 秒。

更多行业研究分析请参考思瀚产业研究院官网，同时思瀚产业研究院亦提供行研报告、可研报告（立项审批备案、银行贷款、投资决策、集团上会）、产业规划、园区规划、商业计划书（股权融资、招商合资、内部决策）、专项调研、建筑设计、境外投资报告等相关咨询服务方案。

免责声明：
1.本站部分文章为转载，其目的在于传播更多信息，我们不对其准确性、完整性、及时性、有效性和适用性等任何的陈述和保证。本文仅代表作者本人观点，并不代表本网赞同其观点和对其真实性负责。
2.思瀚研究院一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及文章内容、版权等问题，我们将及时沟通与处理。