
混元图像3.0图生图模型是腾讯推出的先进图像生成与编辑大模型,基于80B参数混合专家(MoE)架构打造,具备深度理解输入图像与文本编辑指令的能力,可快速生成高质量、真实感强且情绪表现力丰富的图像内容。

HunyuanOCR是腾讯混元团队推出的开源端到端OCR视觉语言模型,其功能覆盖文本检测与识别、复杂文档解析、开放字段信息抽取、视频字幕抽取等经典OCR任务,同时支持端到端拍照翻译与文档问答,为多场景文本处理提供一站式解决方案。

HunyuanVideo 1.5是腾讯混元团队推出的开源轻量级视频生成模型,模型支持文生视频、图生视频双模式生成5-10秒高清内容,具备强大的指令理解能力,可精准复刻写实、动画等多元视觉风格。
混元世界模型1.5(HunyuanWorld-Mirror)是腾讯推出的开源3D世界生成模型,支持多视图图像、视频等多模态输入,可同步输出点云、深度图、相机参数、表面法线、3D高斯点等多样化3D几何预测结果。

PromptEnhancer是腾讯混元团队重磅开源的文本到图像(T2I)提示重写框架,核心聚焦于解决T2I模型对复杂指令理解不足、生成内容与用户意图偏差的行业痛点。

Tencent-HY-MT1.5是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持33种国际语言互译及5种民汉/方言翻译,覆盖多种小语种。

腾讯混元生图是一款提供AI图像生成与处理能力功能,可以结合输入的文本或图像智能创作图像内容,具有更精美的绘图品质、更强大的中文理解能力、更多样的风格选择与更广泛的应用场景。
腾讯混元3D大模型是腾讯自研的3D生成模型,属于其混元大模型体系中的重要组成部分。Hunyuan3D-PolyGen主要解决了3D资产生成中布线质量和复杂物体建模的难题,显著提升了美术师的建模效率,可应用于UGC游戏资产生成。
