
Audio2Face是英伟达推出的AI驱动3D面部动画生成工具,能够根据任意语音音轨,快速生成匹配情绪与节奏的逼真面部动画。

Media2Face是一款基于音频、文本、图像多模态引导的3D面部动画生成工具,专注于打造自然逼真的拟人化面部表情与动作。

BabyVision是UniPat AI团队推出的专业多模态理解评测集,专门用于评估多模态语言模型(MLLMs) 与图像生成模型在视觉推理任务中的核心表现。

GLM-Image是智谱与华为携手打造的新一代多模态图像生成模型,基于昇腾Atlas 800T A2设备与昇思MindSpore框架完成全流程训练,是业内首个依托国产芯片训练的SOTA级图像生成模型。

MoneyPrinter是一款专为短视频创作变现设计的自动化工具,核心功能是输入视频主题即可自动生成YouTube Shorts短视频,全程无需专业视频编辑技能,从内容生成到平台上传全流程自动化,助力快速开启YouTube创作赚钱之路。

OOTDiffusion是一款基于潜在扩散模型打造的高度可控开源虚拟试穿工具,支持根据不同性别、体型自动适配服装版型,实现服装与模特的精准贴合;同时支持自定义参数调整试穿效果,提供半身、全身双模型模式,满足多样化试穿需求。

Animagine XL 3.1是一款专注于动漫领域的开源文本生成图像模型,通过扩充海量标注数据集,实现了对从经典老番到最新作品、从复古风格到现代美学的全维度动漫风格覆盖,为动漫创作者提供高精度、多样化的图像生成解决方案。

StreamMultiDiffusion凭借区域控图、实时交互、全景生成等核心优势,成为一款兼顾专业性与易用性的全能型图像生成编辑工具,为实时AI创作场景提供了高效、灵活的解决方案。

APISR是一款专为动漫内容打造的超分辨率处理项目,聚焦解决现实场景中低质量、低分辨率动漫图像与视频的画质退化问题。它支持2x、4x等多档位上采样因子权重,可精准提升画面清晰度与细节表现力,为动漫爱好者和创作者提供专业的画质增强方案。

AniPortrait是腾讯研发团队打造的音频驱动肖像动画合成工具,仅需输入一段音频与一张静态人脸图片,即可生成表情自然、动作逼真的动态人脸视频,为创意创作、数字内容生产提供高效解决方案。

RTranslator是一款近乎开源、完全免费的Android实时翻译应用,支持离线使用。只需与同样安装该应用的用户建立连接,搭配蓝牙耳机,将手机放入口袋,就能实现如同母语交流般的顺畅对话,彻底打破语言隔阂。

StoryDiffusion是南开大学HVision团队打造的突破性人工智能创作工具,依托一致性自注意力核心技术,无需额外训练即可生成角色、风格高度统一的连贯图像与视频故事,同时支持漫画创作,为叙事类视觉内容生产提供高效解决方案。

HiDiffusion是字节跳动研究团队研发的突破性扩散模型优化工具,无需额外训练,仅需一行代码,即可大幅提升Stable Diffusion(SD)系列模型的图像生成效率与画质。

IDM-VTON是一款融合视觉编码器与UNet模型的先进虚拟试穿技术,可生成超高清、高还原度的虚拟试衣图像;通过深度定制,更能进一步提升图像的一致性与真实质感,为各场景虚拟试穿需求提供专业解决方案。

Baichuan-M3是百川智能正式发布的新一代开源医疗增强大语言模型,专注医疗场景深度优化。其在全球权威医疗AI评测HealthBench与HealthBench Hard中双双夺冠,不仅超越OpenAI的GPT-5.2,更在所有测试环节中表现优于人类医生。
