您当前的位置：首页 > 伙乘资讯 > 36视频创作

WorldDreamer：一种通用世界模型，用于视频生成，能够在图像到视频合成、文本到视频生成、视频修补、视频风格化甚至动作到视频生成等方面展现出卓越的性能

来源：伙乘未来宇宙 时间：2024-06-23 作者：伙乘未来宇宙 浏览量：

WorldDreamer：WorldDreamer: Towards General World Models for Video Generation via Predicting Masked Tokens (world-dreamer.github.io)

WorldDreamer是一种通用世界模型，用于视频生成，通过预测掩码标记的令牌，能够在图像到视频合成、文本到视频生成、视频修补、视频风格化甚至动作到视频生成等方面展现出卓越的性能。

视界一粟YiSu有哪些功能？

1. 图像到视频合成

2. 文本到视频生成

3. 视频修补

4. 视频风格化

5. 动作到视频生成

产品特点：

WorldDreamer通过将图像和视频转换为视觉令牌，并进行令牌掩码操作，将文本和动作输入分别编码为嵌入，作为多模态提示，然后通过STPT预测掩码的视觉令牌，最终通过视觉解码器实现视频生成和编辑。

应用场景：

1. 自然场景视频生成

2. 驾驶环境视频生成

3. 视频编辑

视界一粟YiSu如何使用？

用户可以将图像、文本或动作输入转换为视觉令牌，并通过STPT预测掩码的视觉令牌，最终通过视觉解码器实现视频生成和编辑。

微信扫一扫分享资讯

上一篇：（二）AI视频创作：虚拟视频世界的构下一篇： ToonCrafter：生成式卡通插

相关推荐

暂无相关推荐

热门话题

01健康医疗

02旅游文化

03情感社交

04宠物管理

05心灵疗愈

06礼物创意

07社区资源

08体育竞技

09健身运动

10农业科技

11环境能源

12教育培训

13智能文档

14智能办公

15工作流程

16星际探索

17文化艺术

18区块链

19低代码

20大模型

21智能数据

22数字孪生

23元宇宙

24代码开发

25美容美发

26家居建筑

27影视制作

28人才匹配

29金融投资

30财务管理

31法律法规

32时尚设计

33语言翻译

34文本创作

35故事创作

36视频创作

37内容检测

38音频创作

39学术研究

40品牌设计

41三维创新

42图像创作

43电子商务

4I音乐创作

45美食探索

46游戏开发

47物流运输

48汽车交通

49智能问答

ChatGPT

50营销客服

51信息管理

52搜索引擎

53数字人

54人像艺术

造梦小说

推荐文章

: （三）虚拟人才

虚拟人才市场的技术架构正在经历从二维平面向三

最新文章

: （三）虚拟人才

虚拟人才市场的技术架构正在经历从二维平面向三维立..

账号登录

正在获取二维码...

请使用微信扫一扫登录

二维码已失效点击刷新

请填写用户名

请填写密码

请填写验证码

请填写短信动态码

发送动态码

没有账号？立即注册忘记密码？