
ArenaRL是由通义DeepResearch团队联合高德共同开源的对比式强化学习方法,专为开放域智能体的训练优化设计。目前,ArenaRL不仅在学术基准测试中表现优异,更已在高德地图真实业务场景中完成落地验证,显著提升了智能体在复杂任务中的规划与执行能力。

AgentCPM-Explore是由清华、人大、面壁智能与OpenBMB开源社区联合研发的轻量级开源智能体模型。该模型仅依托4B参数规模,却在多项长程任务评测基准中超越同尺寸乃至更大参数量的模型,展现出极高的能力密度;同时支持超100轮稳定交互,具备强大的深度探索能力。

MagicEdit是字节跳动推出的一款智能视频编辑工具,核心技术亮点在于精准区分视频的外观与动作特征,实现高保真度、时间连贯性的视频编辑,让用户对视频内容和流畅度的控制达到更精细的级别。

DeepFaceLab是一款基于深度学习的人脸交换工具,能精准识别并替换图片、视频中的人脸,生成高度逼真自然的换脸内容。在同类换脸软件中,它以安装最简单、使用最便捷、更新迭代最快的核心优势,成为众多用户的首选工具。

TextBase是一款专为AI聊天机器人开发设计的轻量级Python框架,核心优势在于极简易用、高度可扩展,能帮助开发者快速搭建、迭代和优化聊天机器人,是从入门到生产级聊天机器人开发的优选工具。

EasyPhoto是一款适配WebUI的AI肖像生成插件,核心功能是基于用户上传的肖像照片训练专属数字分身,并通过推理生成个性化AI肖像。它兼顾易用性与灵活性,支持多人生成、多基础模型适配,可在Windows和Linux系统部署,是定制个人数字分身的高效工具。

DeepFaceLive是一款免费开源的实时直播AI换脸工具,基于先进深度学习算法,可实现高度逼真的面部合成效果——将一个人的面部特征精准映射到另一个人的身体视频中,完美还原原面部的表情、动作细节,为影视制作、游戏开发、虚拟现实等领域提供高效创新的技术解决方案。

CustomNet是一个在文本到图像生成领域,将自定义对象(如特定商品)自然融入新场景并完整保留其样式、纹理细节,是极具实用价值的核心需求——尤其为商品图融合、创意设计等场景提供了全新可能。

易魔声EmotiVoice是一款功能强大的开源TTS引擎,核心亮点在于支持中英文双语合成、覆盖2000+多样化音色,以及行业领先的情感合成能力——可精准生成快乐、兴奋、悲伤、愤怒等多种情绪语音,为语音内容创作注入丰富情感张力。
InvokeAI是一款基于Stable Diffusion模型的开源全能型AI图像生成与处理平台,核心优势在于通过简化的工作流程、丰富的功能扩展与低门槛部署特性,让专业创作者、艺术家与爱好者轻松驾驭AI生成技术。

LiveSketch是一款聚焦“素描动效化”的AI生成视频工具,它为用户提供了直观、低门槛的创作方式,无需专业动画技能,就能让寥寥几笔的涂鸦或素描赋予生命,广泛适配讲故事、插画展示、网站设计、演示文稿等多元场景,让静态视觉内容更丰富有趣。

LucidDreamer是一款一款无域限制的3D场景生成管道,深度借助现有大规模扩散生成模型的强大能力,实现跨领域、高保真的3D场景创作。

与传统“单纯放大”不同,DemoFusion采用创新的补丁式处理方案:先通过Stable Diffusion等免费开源AI模型生成低分辨率基础图像,再通过专属框架挖掘模型潜力,为图像添加丰富细节并提升分辨率,实现“超分+细节增强”的双重效果,而非简单拉伸像素。

HandRefiner提出一种针对性图像后处理方法,核心目标是在完全保留图像其他部分原貌的前提下,精准修正生成图像中形状异常的手部。
DreamTalk是由清华大学、阿里巴巴与华中科技大学联合开发的扩散模型驱动面部动画生成框架,核心能力是让静态人物照片“开口说话”,支持匹配歌曲、多语言语音、嘈杂音频等多种声音类型,生成的唇部动作与表情风格高度自然逼真,打破了传统照片说话技术对纯净音频、表情参考的依赖。
