返回IT知识

HumanDiT：一款由浙大联合字节推出的姿态引导的高保真人体视频生成框架

542 ℃

HumanDiT 是由浙江大学和字节跳动联合提出的一种姿态引导的高保真人体视频生成框架。它基于扩散变换器（Diffusion Transformer，DiT），能够在大规模数据集上进行训练，生成具有精细身体渲染的长序列人体运动视频。

HumanDiT：一款由浙大联合字节推出的姿态引导的高保真人体视频生成框架

HumanDiT功能特点：

1、姿态引导的视频生成：HumanDiT 通过关键点扩散变换器（Keypoint-DiT）生成后续姿态序列，确保视频中人体动作的连贯性和自然性。

2、长序列视频生成：支持多种视频分辨率和可变序列长度，适合生成长序列的高质量视频。

3、个性化特征保持：引入前缀潜在参考策略，在长序列中保持个性化特征。

4、灵活的输入与输出：能从静态图像或现有视频中继续生成视频，适用于多种应用场景。

5、姿态适配与细化：基于姿态适配器实现给定序列的姿态转移，通过姿态细化模块增强面部和手部特征与参考图像的对齐效果。

HumanDiT项目地址：

1、官方网址：https://agnjason.github.io/HumanDiT-page/

2、arXiv 技术论文：https://arxiv.org/pdf/2502.04847

相关阅读文章

Protenix-v1模型使用入口，开源生物分子结构预测的新标杆

DeepGen 1.0模型使用入口，浙江大学等联合推出的轻量级统一多模态模型，仅50亿参数

BitDance模型使用入口，字节跳动正式开源的140亿参数离散自回归多模态基础模型

Seed2.0模型官网使用入口，字节跳动Seed团队推出的新一代通用Agent大模型家族

Seedream 5.0 Lite模型官网使用入口，字节跳动新一代AI图像创作模型

标签：字节跳动框架浙江大学视频生成框架

上面是“HumanDiT：一款由浙大联合字节推出的姿态引导的高保真人体视频生成框架”的全面内容，想了解更多关于 IT知识 内容，请继续关注web建站教程。

当前网址：https://ipkd.cn/webs_17001.html

声明：本站提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请发送到邮箱：admin@ipkd.cn，我们会在看到邮件的第一时间内为您处理！

当前位置： 首页 > IT知识

Trae：新一代免费的AI编程工具

即梦AI网页版

支持多图参考 · 生成高质量图像及视频！！

豆包网页版

支持AI聊天，AI图片生成，AI漫画生成，AI写作等……

最新文章

: DeepSeek-V4模型 - 包含deepseek-v4-pro和deepseek-v4-flash两个版本，拥有百万字超长上下文窗口

: Qwen3.6-Plus编程模型 - 阿里通义重磅Agent编程模型，百万上下文+超强编码智能体

: 京东JoyMed医疗大模型 - 里程碑级医疗多模态大模型，重新定义AI诊疗新范式

: 小米OmniVoice官网 - 小米K2-Fsa重磅TTS模型，600+语言+极速克隆

: TimelessHome.AI官网 - 一款AI室内设计与虚拟家居布置平台

精选热门文章

: 豆包网页版：支持AI聊天，AI图片生成，AI漫画生成，AI写作等

: IDM-VTON：重塑虚拟试穿体验的前沿技术

: Nano Banana 2 Pro官网使用入口，在线的AI图像生成与编辑工具

: GPTBots：一站式企业级AI Bot开发与部署平台

: Lesson Plan Generator官网使用入口，内置CCSS、NGSS及各州课程标准数据库

: CL-bench：腾讯混元与复旦大学联合推出的Context学习能力评测基准

日历：

上一篇：LONGLIVE：英伟达联合研发的实时交互式长视频生成框架

下一篇：一款基于扩散模型的可控制视频生成框架——DreaMoving

x

打工人ai神器

x

扫一扫打开藏历小程序

打开微信“扫一扫”查看今日藏历！