web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

Solaris多人视频模型官网入口,累计收集1260万帧多人游戏标注数据

53 ℃

Solaris是全球首个多人视频世界生成模型,专注于在Minecraft场景中,同步生成两位玩家一致的第一人称视角视频。模型彻底突破现有模型仅支持单玩家的技术局限,核心实现跨玩家视角的空间一致性——当一位玩家执行建造、移动等动作时,另一玩家的视角会实时同步反映场景变化。

Solaris多人视频模型官网入口,累计收集1260万帧多人游戏标注数据

Solaris核心功能:

1、多人视角同步生成

核心能力的是同时为两位玩家生成视角一致的第一人称视频,严格保障跨玩家的空间一致性,一位玩家的任何动作(建造、移动、挖掘等),都会在另一玩家视角中实时同步呈现,还原真实多人游戏交互场景。

2、长时序稳定生成

依托Checkpointed Self Forcing核心技术,可生成长达224帧(11.2秒)的稳定视频序列,有效规避长序列生成中误差累积导致的视觉退化、场景错乱等问题,确保视频连贯性与真实性。

3、动作条件精准控制

全面支持完整的Minecraft动作输入,包括移动、相机调整、挖掘、放置方块等,生成的视频严格遵循给定的动作序列,实现动作与视觉呈现的精准匹配,可控性极强。

4、复杂动态场景模拟

可精准模拟Minecraft中的各类复杂动态,涵盖背包状态同步、天气变化、物理建造与破坏、PvP战斗等,高度还原多人游戏中的真实交互场景,满足多样化模拟需求。

Solaris技术原理:

1、多人DiT架构

基于MatrixGame 2.0单玩家扩散Transformer架构升级,通过扩展动作空间适配完整Minecraft动作输入;引入跨玩家自注意力层,实现两位玩家视角信息的实时交换;添加玩家ID嵌入模块,精准区分不同玩家视角,其余交叉注意力、FFN等模块保留单玩家架构优势,兼顾性能与效率。

2、四阶段渐进训练

以单玩家预训练权重为基础,第一阶段在VPT数据集上微调,适配Minecraft动作空间;第二阶段切换至多人数据,训练双向模型作为教师模型;第三阶段将双向模型因果化为滑动窗口生成器;第四阶段通过Checkpointed Self Forcing技术,实现长序列稳定生成,完成全流程训练。

3、Checkpointed Self Forcing 技术

针对滑动窗口自回归生成的内存瓶颈,创新采用“先无梯度生成并缓存干净帧与噪声状态,再通过自定义注意力掩码单次并行重计算”的方式,严格复现滑动窗口依赖关系,将内存复杂度从 O(Lt⋅Ls) 降至 O(Lt),同时支持KV缓存梯度回传,大幅提升生成视频的质量与稳定性。

4、SolarisEngine 数据系统

针对现有框架缺乏多人场景支持的痛点,构建基于 Mineflayer 的控制器与官方Minecraft客户端的相机分离架构;通过服务器插件实现多玩家状态实时同步,采用Docker容器化技术,实现数据采集的并行扩展与故障自动恢复,最终完成1260万帧动作标注的多人游戏数据采集,为模型训练提供高质量数据支撑。

Solaris应用场景:

1、具身智能训练与评估

作为高性能多智能体世界模拟器,为机器人、游戏AI提供高质量合成训练数据,支持策略学习、推理时规划及安全评估,有效规避真实环境中试错的高昂成本,加速具身智能落地。

2、多智能体协作研究

可精准模拟多人协同任务,如共同建造、团队战斗等场景,用于训练AI代理的协作能力与通信能力,助力研究多智能体的emergent行为(涌现行为)与社会智能。

3、视觉-语言-动作(VLA)模型开发

能够生成大规模、高质量的多视角视频-动作-语言对齐数据,为VLA模型的预训练与微调提供充足数据支撑,有效弥补真实人类多人交互数据稀缺的行业痛点。

4、3D场景理解与空间推理基准

作为可控性极强的测试平台,可精准评估模型在视角一致性、物体持久性、空间记忆等核心3D理解能力上的表现,为3D视觉模型的研发与优化提供标准测试场景。

相关阅读文章

Seedance 3.0模型官网使用入口,字节跳动AI视频生成器

Seedance 2.0 Pro官网使用入口,字节跳动自研、基于即梦AI模型的AI视频生成平台

Seedance 2:字节跳动多模态AI视频生成模型,电影级创意落地工具

Seedance 2.0:模型支持首尾帧、视频片段、音频多维度综合参考

HunyuanCustom:支持文本、图像、音频、视频多模态输入的多模态定制视频生成框架

标签: AI视频生成模型

上面是“Solaris多人视频模型官网入口,累计收集1260万帧多人游戏标注数据”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。

当前网址:https://ipkd.cn/webs_31692.html

Solaris(官网) 打不开万能教程:

1、微信/QQ内打不开:

把链接复制到系统浏览器再访问,微信/QQ内置页常自动拦截第三方站。

2、浏览器报“违规”:

部分国产浏览器的误拦截,换用系统原生浏览器即可:iPhone→Safari,安卓→Edge、Alook、X、Via 等轻量浏览器,均不会误屏蔽。

3、网络加载慢或空白:

先切换 4G/5G 与 Wi-Fi 对比;可以尝试使用网络加速器,将网络切换至更稳定的运营商。另外,部分网站可能需要科学上网才能访问,如Google、Hugging Face等一些国外服务器的网站(不推荐)。

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

当前位置: 首页 > AI项目和框架
Trae:新一代免费的AI编程工具

在线育儿补贴计算器

快来看看你到底可以领到多少补贴!生活小工具
上一篇:
下一篇:
x 打工人ai神器