web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

AI项目和框架

TranslateGemma:谷歌Gemma 3生态力作,多模态开源翻译模型
TranslateGemma:谷歌Gemma 3生态力作,多模态开源翻译模型

TranslateGemma是谷歌基于Gemma 3大模型架构推出的新一代开源翻译模型系列,该模型提供4B、12B、27B三种参数规模版本,分别适配移动设备、消费级笔记本、云端高性能计算平台,真正做到全场景灵活部署。

多语言翻译模型谷歌开源
Ling-1T:蚂蚁集团开源万亿参数旗舰模型,高效推理引领开源第一梯队
Ling-1T:蚂蚁集团开源万亿参数旗舰模型,高效推理引领开源第一梯队

Ling-1T是蚂蚁集团重磅推出的万亿参数级开源语言模型,定位为“旗舰级非思考模型”。依托先进的 MoE(Mixture of Experts)混合专家架构,模型总参数量高达 1 万亿,推理时仅激活约 510 亿参数,在兼顾极致性能的同时大

大型语言模型蚂蚁集团
Gemini 2.5 Computer Use:让AI自主操控浏览器的智能自动化工具
Gemini 2.5 Computer Use:让AI自主操控浏览器的智能自动化工具

Gemini 2.5 Computer Use是谷歌DeepMind基于Gemini 2.5大模型打造的智能计算机操作模型,突破性实现AI对浏览器的直接控制,可自主执行点击、滚动、输入等交互动作。依托强大的视觉理解与逻辑推理能力,模型能精准

AI自动化工具DeepMindGemini谷歌AI
Imagine v0.9:xAI重磅发布,20秒生成电影感视频的高效创作工具
Imagine v0.9:xAI重磅发布,20秒生成电影感视频的高效创作工具

Imagine v0.9是xAI公司推出的新一代视频生成模型,该模型可在20秒内生成6秒左右的高质量视频,支持精准运动控制、动态相机特效、自然对话与歌声合成,更配备语音优先交互界面,用户通过语音指令即可快速完成创作。

xAI公司视频生成模型马斯克
FunAudio-ASR:阿里达摩院出品,企业级语音识别痛点的端到端大模型
FunAudio-ASR:阿里达摩院出品,企业级语音识别痛点的端到端大模型

FunAudio-ASR是阿里巴巴达摩院研发的端到端语音识别大模型,聚焦企业落地场景中的核心痛点,通过创新的Context增强模块,从根源上优化了语音识别领域的“幻觉”“串语种”等行业难题。

端到端大模型语音识别模型阿里达摩院
GPT-5-Codex:OpenAI重磅推出重构软件工程全流程的智能编程助手
GPT-5-Codex:OpenAI重磅推出重构软件工程全流程的智能编程助手

GPT-5-Codex-Mini是OpenAI打造的经济高效型轻量版本。作为GPT-5-Codex的紧凑迭代,其模型体积更小、使用成本更低,完美适配基础代码生成、功能模块添加等轻量级编程需求。目前,该模型已上线CLI工具与IDE扩展插件,为开发者提供灵活、高性价比的智能编程选择。

Agent框架OpenAI智能编程助手编程优化模型
Mini-o3:字节跳动 × 香港大学联合开源,攻克复杂视觉搜索难题
Mini-o3:字节跳动 × 香港大学联合开源,攻克复杂视觉搜索难题

Mini-o3在VisualProbe、V* Bench等多个权威视觉搜索基准测试中斩获SOTA(State-of-the-Art)性能,全套代码、预训练模型及数据集已完全开源,为全球研究者提供可复现、可拓展的技术底座。

字节开源字节跳动框架视觉推理模型香港大学
UnifoLM-WMA-0:宇树科技开源跨机器人架构,赋能通用机器人自主学习与决策
UnifoLM-WMA-0:宇树科技开源跨机器人架构,赋能通用机器人自主学习与决策

UnifoLM-WMA-0架构已成功部署于真实机器人,实现动作可控生成与长期交互生成的双重突破,显著提升机器人在复杂动态环境中的自主学习与决策能力。

宇树科技机器人框架
PromptEnhancer:腾讯混元开源提示重写框架,解锁T2I模型精准生成新潜能
PromptEnhancer:腾讯混元开源提示重写框架,解锁T2I模型精准生成新潜能

PromptEnhancer是腾讯混元团队重磅开源的文本到图像(T2I)提示重写框架,核心聚焦于解决T2I模型对复杂指令理解不足、生成内容与用户意图偏差的行业痛点。

提示词生成器混元大模型腾讯开源
通义DeepResearch:阿里开源深度研究智能体,赋能长周期复杂任务高效突破
通义DeepResearch:阿里开源深度研究智能体,赋能长周期复杂任务高效突破

通义DeepResearch无需人工干预即可生成高质量训练数据集,突破传统智能体的数据瓶颈;构建“智能体持续预训练(Agentic CPT)—监督微调(SFT)—强化学习(RL)”的端到端完整训练链路,确保模型能力的系统性迭代。

智能体模型通义实验室阿里开源
WebResearcher:隶属通义DeepResearch家族,阿里通义迭代式深度研究智能体
WebResearcher:隶属通义DeepResearch家族,阿里通义迭代式深度研究智能体

WebResearcher作为阿里巴巴通义实验室重磅推出的迭代式深度研究智能体,精准模拟人类专家的认知工作流程。它具备自主拆解复杂问题、智能协调工具调用、整合碎片化信息输出有理有据报告的核心能力,与传统研究智能体相比,通过分阶段处理研究全流程。

Agent框架智能体模型阿里通义
WebWeaver:阿里通义双智能体研究框架,重塑开放性深度研究新范式
WebWeaver:阿里通义双智能体研究框架,重塑开放性深度研究新范式

WebWeaver的核心突破在于动态大纲优化机制——将研究大纲视为可实时更新的“活文档”,在全网信息检索与大纲细化完善之间构建循环链路,让研究方向随新发现动态演变,确保研究深度与前沿性。

Agent框架阿里通义
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验

VoxCPM支持零样本声音克隆,仅需一段参考音频,即可精准复刻说话者的音色、口音、情感语调等细微特征,生成高度逼真的个性化语音。其推理效率同样表现卓越,在NVIDIA RTX 4090 GPU上实时因子(RTF)低至0.17,完美满足实时交互场景需求。

GitHub仓库清华大学语音生成模型面壁智能
DeepSeek-R1-Safe:浙大与华为联合研发的安全专项大模型
DeepSeek-R1-Safe:浙大与华为联合研发的安全专项大模型

DeepSeek-R1-Safe是浙江大学网络空间安全学院与华为联合研发的安全专项大模型,基于DeepSeek系列模型迭代升级,深度适配华为昇腾芯片与MindSpeedLLM框架,构建起“安全语料构建—安全监督训练—强化学习优化”的全链路技术体系。

DeepSeek模型华为AI安全大模型浙江大学
Granite-Docling-258M:IBM轻量级视觉语言模型
Granite-Docling-258M:IBM轻量级视觉语言模型

Granite-Docling-258M模型支持阿拉伯语、中文、日语等多语言处理,并创新性采用DocTags格式精准描述文档结构,搭配与Docling库的无缝集成能力,赋予用户强大的定制化空间与错误处理机制,成为企业级文档智能化升级的高效利器。

AI视觉语言模型IBM模型
Trae:新一代免费的AI编程工具