web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

AI项目和框架

TADA模型使用入口,通过激活引导微调音频扩散模型
TADA模型使用入口,通过激活引导微调音频扩散模型

TADA的核心目标是打开AI音乐模型的”黑盒”,定位控制各类音乐属性的独立”开关”,让用户像调节音响旋钮一样,对速度、情绪、音色等维度进行精准、解耦的细粒度控制。

AI音乐生成AI音频扩散模型github项目
Qwen3.5模型使用入口,开源版本Qwen3.5-397B-A17B采用创新混合架构
Qwen3.5模型使用入口,开源版本Qwen3.5-397B-A17B采用创新混合架构

Qwen3.5通过早期文本-视觉融合、M-RoPE及3D位置编码技术,统一支持文本、图像、视频多任务处理,语言覆盖从119种扩展至201种。权威评测中表现顶尖:MMLU-Pro得分87.8超越GPT-5.2,GPQA得分88.4高于Claude 4.5,IFBench指令遵循评分76.5刷新行业纪录。

多模态AI模型通义千问阿里通义
Qwen-Image-Edit-Causal模型使用入口,Light AI优化版图像编辑模型
Qwen-Image-Edit-Causal模型使用入口,Light AI优化版图像编辑模型

Qwen-Image-Edit-Causal V1.0是Light AI针对Qwen-Image-Edit-2511推出的关键优化版本,核心突破在于引入分块因果注意力机制,实现“编辑质量不打折、推理速度大幅提升”的双重优势,既延续了前代模型的精准编辑能力,又解决了图像编辑中“耗时久、效率低”的核心痛点,适配更多实时编辑与批量处理场景。

Light AIQwen Image图像编辑模型
Kimi Claw模型使用入口,月之暗面Moonshot AI云端AI智能体服务
Kimi Claw模型使用入口,月之暗面Moonshot AI云端AI智能体服务

Kimi Claw是月之暗面推出的云端AI智能体服务,核心是Kimi K2.5大模型与开源AI Agent平台OpenClaw的深度集成方案,堪称当前性价比顶尖的“模型+Agent”组合。它既保留OpenClaw的自动化助手核心能力,又无需用户进行本地部署与维护——在Kimi平台几秒内即可完成部署。

AI智能体KimiMoonshotAI云端AI月之暗面
CoPAW官网使用入口,阿里云通义实验室个人智能体工作台,你的专属数字搭档
CoPAW官网使用入口,阿里云通义实验室个人智能体工作台,你的专属数字搭档

CoPaw是阿里云通义实验室重磅推出的个人智能体工作台,平台内置文档处理、新闻阅读、浏览器操作等多种基础能力(Skills),同时支持自定义Skill轻松扩展功能边界,无需修改底层代码。

AI智能体工作台对话交互AI阿里通义
JoyAI-LLM-Flash模型使用入口,京东AI开源的最新大语言模型
JoyAI-LLM-Flash模型使用入口,京东AI开源的最新大语言模型

JoyAI-LLM-Flash是京东在Hugging Face正式开源的最新大语言模型,该模型采用混合专家(MoE)架构,总参数达480亿,而每次推理仅激活30亿参数,既能保持强大的模型能力,又能显著降低计算开销。

HuggingFace模型库MoE架构京东框架
KaniTTS2模型使用入口,NineNineSix正式开源的新一代TTS模型
KaniTTS2模型使用入口,NineNineSix正式开源的新一代TTS模型

KaniTTS2是AI初创公司NineNineSix正式开源的新一代文本转语音(TTS)模型,专为低延迟、高自然度的实时对话场景量身打造。该模型支持语音克隆、多语言输出,同时提供完整的从零预训练代码框架,助力开发者基于自有数据快速训练定制化TTS模型。

NineNineSixTTS模型文本转语音模型
Xiaomi-Robotics-0模型官网首页入口,小米开源的首代机器人VLA(视觉-语言-动作)大模型
Xiaomi-Robotics-0模型官网首页入口,小米开源的首代机器人VLA(视觉-语言-动作)大模型

Xiaomi-Robotics-0模型是小米开源的首代机器人VLA(视觉-语言-动作)大模型,搭载47亿参数,创新采用MoT混合架构——以Qwen3-VL多模态模型为“大脑”,负责解析视觉与语言指令、理解场景意图;以Diffusion Transformer(DiT)为“小脑”,专注生成高频平滑动作块。

Qwen3-VL小米开源AI机器人VLA模型
Ming-omni-tts模型官网使用入口,大幅提升推理效率,推理帧率可低至3.1Hz,有效降低延迟
Ming-omni-tts模型官网使用入口,大幅提升推理效率,推理帧率可低至3.1Hz,有效降低延迟

Ming-omni-tts核心依托团队自研技术,采用12.5Hz连续分词器,搭配逐块压缩技术,在坚守高音质输出的基础上,大幅提升推理效率,推理帧率可低至3.1Hz,有效降低延迟。同时,模型具备强劲的文本正则化能力,能够准确、自然地朗读复杂数学公式与化学方程式,完美适配专业内容播报、教育科普等对文本解析要求较高的场景。

HuggingFace模型库inclusionAI团队ModelScope社区蚂蚁集团
Hibiki-Zero模型官网使用入口,30亿参数的同步语音到语音翻译模型
Hibiki-Zero模型官网使用入口,30亿参数的同步语音到语音翻译模型

Hibiki-Zero继承其前身Hibiki的多流RQ-Transformer架构,采用仅解码器设计,核心依托流式神经音频编解码器Mimi,以12.5Hz恒定帧率,对源音频、目标音频,以及用于内部推理的“内心独白”文本流进行联合建模。这种一体化设计赋予模型持续处理输入语音流的能力,可同步输出连续的翻译音频及带时间戳的对应文本,完美适配实时交互场景。

Kyutai实验室语音翻译模型
Seed2.0模型官网使用入口,字节跳动Seed团队推出的新一代通用Agent大模型家族
Seed2.0模型官网使用入口,字节跳动Seed团队推出的新一代通用Agent大模型家族

Seed 2.0是字节跳动Seed团队自研推出的新一代通用Agent大模型家族,由Pro/Lite/Mini三款通用模型与Code专用模型组成,全面升级多模态理解、长上下文处理与复杂任务执行能力,兼顾顶尖性能与普惠成本。

Agent大模型AI通用模型Seed团队字节跳动框架豆包大模型
Ovis2.6-30B-A3B模型使用入口,阿里国际Ovis系列多模态大语言模型
Ovis2.6-30B-A3B模型使用入口,阿里国际Ovis系列多模态大语言模型

Ovis2.6-30B-A3B核心升级为MoE架构,实现300亿总参数与仅30亿激活参数的平衡,兼顾大模型能力与小模型推理成本;MoE架构提效降本、64K长上下文+高清图像处理、主动式图像思考、强化的OCR/文档/图表理解。

AI多模态模型HuggingFace模型库MoE架构Ovis系列阿里国际
FireRed-Image-Edit模型使用入口,小红书出品通用图像编辑模型,打破专业修图门槛
FireRed-Image-Edit模型使用入口,小红书出品通用图像编辑模型,打破专业修图门槛

FireRed-Image-Edit核心优势是精准理解自然语言指令,实现高保真、视觉一致的全维度图像编辑,解决现有AI修图“改不准、易翻车、门槛高”的痛点;功能覆盖内容/风格/结构/文字四大维度,还支持虚拟试穿、老照片修复等特色玩法,适配日常修图、电商、创意创作等多场景。

图像编辑模型小红书开源
Nanbeige4.1-3B模型使用入口,30亿参数全能型开源模型,推理/对齐/智能体能力全拉满
Nanbeige4.1-3B模型使用入口,30亿参数全能型开源模型,推理/对齐/智能体能力全拉满

Nanbeige4.1-3B以30亿小参数规模打破性能桎梏,通过多轮优化实现推理、对齐、智能体能力全方位提升;为小模型生态提供全能化发展新范式,保留轻量化部署优势的同时,具备比肩大模型的核心性能。

AI推理专用模型HuggingFace模型库Nanbeige
Ring-2.5-1T模型魔塔使用入口,蚂蚁集团开源万亿参数思维模型
Ring-2.5-1T模型魔塔使用入口,蚂蚁集团开源万亿参数思维模型

Ring-2.5-1T是蚂蚁集团推出的全球首个万亿参数混合线性注意力开源思维模型,核心实现“想得深、推得快、做得久”;模型开源且轻量化,重新定义万亿参数模型的性能边界,为通用人工智能体研发奠定关键基础。

HuggingFace模型库开源思维模型AI蚂蚁集团魔塔社区
Trae:新一代免费的AI编程工具