
即梦AI(原名Dreamina)是由字节跳动旗下的剪映团队推出的一款一站式AI创作平台。其核心功能包括文生图(文字生成图像)、文/图生视频(文字或图片生成视频)以及智能画布等。

字节旗下AI代码助手程,国内首款原生AI IDE,它不仅提供智能代码生成、优化和调试功能,还通过多模态交互、上下文感知和跨语言支持等创新技术,帮助开发者高效完成项目开发。

MedGemma 1.5是谷歌推出的开源多模态医学专用模型,专为处理医学影像与文本数据设计,深度整合高维影像解读、医学文档理解、电子健康记录(EHR)分析等核心能力。

Workus是一款聚焦B2B销售场景的智能获客平台,依托AI技术重构企业客户开发与跟进流程。它能深度解析企业业务需求,自动整合官网、文档、客户画像等核心信息,精准定位关键决策人。

阿里巴巴达摩院团队研发的DDColor,作为魔搭大模型生态下的新一代图像上色算法,凭借创新的双解码器技术,实现了图像上色领域的变革性突破。无论是历史黑白照片、动漫场景还是游戏风景,都能输出色彩自然、细节逼真的彩色图像,尤其在多物体、复杂上下文场景中表现突出。

LibreChat是一款免费开源的增强版ChatGPT替代平台,核心优势是深度整合全球主流AI模型与丰富扩展功能,既还原ChatGPT的直观交互体验,又突破单一模型的能力局限。

DiffusionGPT是字节跳动研发的大语言模型驱动型文本生成图像多合一系统,核心目标是精准解析各类文本提示,智能匹配最优图像生成模型,输出高质量、高契合度的图像内容。

Lumiere是谷歌研究院研发的时空文本到视频扩散模型,核心创新在于采用空间时间U-Net架构——摒弃传统模型逐帧合成的模式,通过单次传递即可生成视频的完整时间序列,从根源上保障视频的全局时间一致性与画面逼真度,赋能多元内容创作与视频编辑任务。

SupIR是一项通过模型规模扩容实现图像修复能力跃升的突破性技术,依托生成先验与多模态融合技术,支持文本提示驱动的智能修复,大幅提升图像修复的质量、精细度与智能化水平,为图像复原、画质增强领域带来全新解决方案。

ctoCodingBench是MiniMax推出的Coding Agent专项评测集,核心目标是评估代码生成Agent在真实软件开发场景中的指令遵循能力。

DuckDB-NSQL是一款针对 DuckDB 数据库定制的文本到SQL专用模型,核心能力是将用户的自然语言查询需求,精准转换成可直接执行的DuckDB SQL代码——让你无需掌握SQL语法,仅用日常语言就能与数据库“对话”,大幅简化数据查询与处理流程。
StreamRAG是一款开源的视频搜索与流媒体代理工具,核心能力是让你在 ChatGPT 中与自有视频库“对话”并直接观看视频流。

司农大语言模型是南京农业大学依托自身学科优势打造的农业领域垂直大模型,收集了涵盖多农业学科的超40亿token数据,包括书籍、论文、政策等。

WhisperFusion是一款基于开源工具WhisperLive与WhisperSpeech打造的实时对话解决方案,核心优势在于实现人与AI聊天机器人的超低延迟交互。

PixVerse R1是爱诗科技(PixVerse)推出的全球首个通用实时世界模型,它重新定义了实时视频生成的效率与交互体验:Omni原生多模态基础模型实现文本、图像、音频、视频的一体化生成。

Audio2Face是英伟达推出的AI驱动3D面部动画生成工具,能够根据任意语音音轨,快速生成匹配情绪与节奏的逼真面部动画。

Media2Face是一款基于音频、文本、图像多模态引导的3D面部动画生成工具,专注于打造自然逼真的拟人化面部表情与动作。
