web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

BitDance模型使用入口,字节跳动正式开源的140亿参数离散自回归多模态基础模型

161 ℃

BitDance是字节跳动正式开源的140亿参数离散自回归多模态基础模型。凭借创新的二进制Token编码机制与并行扩散预测范式,模型在保持高分辨率、高保真画质的前提下,实现了颠覆性的生成速度,效率较传统自回归模型提升30倍以上,甚至超越多款主流扩散模型。

BitDance模型使用入口,字节跳动正式开源的140亿参数离散自回归多模态基础模型

BitDance核心功能:

1、高质量文生图

支持写实、动漫、油画等多元风格生成。在DPG‑Bench图文匹配度评测中取得88.28分,位列自回归模型第一;GenEval综合评测得分0.86,综合表现领先。

2、高分辨率原生输出

支持1024×1024高清分辨率,细节还原度高,可精准渲染招牌、标语等文字内容,有效解决AI生成图像常见的文字乱码问题。

3、极致推理速度

1024px高清图像仅需12.4秒即可生成。对比同类方案:NextStep‑1需402秒、GLM‑Image需53.2秒,速度提升达30倍+。

4、高效多语言能力

在OneIG中英双语评测中,以更少训练数据达到与闭源商业模型相近的效果,数据效率突出。

BitDance技术原理:

1、二进制编码

通过高压缩视觉分词器将图像转为256位二进制Token,在极高压缩比下仍近乎无损保留细节。

2、分块并行生成

将画面按Patch分块处理,按序逐块生成,替代逐Token串行生成,大幅提升效率。

3、并行扩散预测(核心)

对每个Patch启动轻量化扩散引擎,从噪声快速去噪,一次性确定块内64个Token,实现“整块生成”而非逐点绘制。

4、高清解码

所有块生成完成后,二进制序列经解码器直接还原为清晰高清图像。

BitDance相关网址:

1、项目主页:https://bitdance.csuhan.com/

2、GitHub:https://github.com/shallowdream204/BitDance

3、Hugging Face模型:https://huggingface.co/collections/shallowdream204/bitdance

4、Demo:https://huggingface.co/spaces/shallowdream204/BitDance-14B-64x

相关阅读文章

Mistral Small 4模型使用入口,Mistral AI 开源的多模态大模型

Fun-CineForge模型使用入口,通义实验室开源的影视级多模态配音大模型

InternVL-U多模态模型使用入口,上海AI实验室正式推出,仅40亿参数的轻量级模型

ZUNA是一款仅3.8亿参数的轻量化设计的开源脑电图(EEG)基础模型

Protenix-v1模型使用入口,开源生物分子结构预测的新标杆

标签: AI多模态模型 AI绘画模型 字节跳动框架

上面是“BitDance模型使用入口,字节跳动正式开源的140亿参数离散自回归多模态基础模型”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。

当前网址:https://ipkd.cn/webs_31187.html

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

当前位置: 首页 > AI项目和框架

BitDance模型 官网

https://bitdance.csuhan.com/
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具
上一篇:
下一篇:
x 打工人ai神器
x 扫一扫打开藏历小程序

打开微信“扫一扫”查看今日藏历!