web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

AI项目和框架

OmniParser V2:微软研究院研发的GUI理解模型,提升准确性与效率
OmniParser V2:微软研究院研发的GUI理解模型,提升准确性与效率

OmniParser V2主要面向开发者、企业研发团队、自动化测试工程师及AI应用厂商,尤其适合希望基于LLM构建智能GUI交互系统的团队。其核心价值在于提升GUI自动化的精度与效率、降低开发成本,并为终端用户提供更流畅的智能交互体验。

AI人工智能GUI自动化微软研究院魔塔社区
Radar:涵盖关键词监控、趋势可视化等的社交媒体趋势分析高级工具
Radar:涵盖关键词监控、趋势可视化等的社交媒体趋势分析高级工具

Radar是一款聚焦社交媒体趋势分析的高级搜索工具,核心功能涵盖关键词监控、趋势可视化、对话过滤与实时帖子计数统计,助力用户在信息爆炸的社交环境中快速捕捉高价值信息。

AI搜索工具AI社交媒体AI趋势监控国外AI框架
Grok 3:马斯克旗下xAI公司推出的新一代旗舰级深度推理多模态AI模型
Grok 3:马斯克旗下xAI公司推出的新一代旗舰级深度推理多模态AI模型

Grok 3是埃隆・马斯克旗下xAI公司推出的新一代旗舰AI模型,凭借算力升级与超大规模数据集支撑,实现复杂数学、科学问题的深度解析,全面支持多模态输入交互。其核心优势在于顶尖推理能力—— 能提供高精度答案,在多项权威基准测试中超越现有顶尖模型,标志着xAI在AI领域的突破性进展。

AI推理架构Elon MuskxAI公司马斯克
Xcode 26.3苹果原生智能体编程,接入Claude Agent、Codex等模型

Xcode 26.3是苹果公司候选版推出原生智能体编程功能,接入Claude Agent、Codex等模型,通过MCP协议赋予AI工具调用能力,实现自动化编码、文档查阅与测试,同时以里程碑快照保障开发者控制权,降低开发门槛并提升效率。

AI智能体AI编程苹果AI
可灵AI 3.0:快手可灵AI推出的新一代多模态AI创作模型
可灵AI 3.0:快手可灵AI推出的新一代多模态AI创作模型

本次更新包含四大核心版本:视频3.0新增AI智能分镜、15秒长视频、多语种及方言口型同步、图生视频主体参考;视频3.0 Omni强化全能参考与音色克隆能力;图片3.0支持10张参考图融合与自由编辑;图片3.0 Omni 提供2K/4K原生超清输出与批量组图创作。

AI创作模型AI图像模型可灵AI多模态AI模型
CL-bench:腾讯混元与复旦大学联合推出的Context学习能力评测基准
CL-bench:腾讯混元与复旦大学联合推出的Context学习能力评测基准

CL-bench是一个专注衡量大语言模型从全新上下文信息中实时学习、应用知识的核心能力。该基准包含500个专家精心构建的复杂场景、1899个任务,全面覆盖领域知识推理、规则系统应用、程序性任务执行和经验发现与模拟四大类别。

复旦大学大模型评测基准机器学习模型腾讯AI腾讯混元AI
MiniCPM-o 4.5模型:具备视觉理解、超拟人语音生成及声音克隆能力
MiniCPM-o 4.5模型:具备视觉理解、超拟人语音生成及声音克隆能力

MiniCPM-o 4.5是面壁智能开源的9B参数全模态旗舰模型,该模型具备领先的视觉理解、超拟人语音生成及声音克隆能力,支持主动交互与实时流媒体处理,可在端侧设备运行,已适配昇腾、海光等多种国产芯片,通过llama.cpp、vLLM等框架实现高效部署。

AI全模态模型AI声音克隆智能交互平台面壁智能
ACE-Step 1.5:ACE Studio × StepFun联合开源商业级音乐生成基础模型

ACE-Step 1.5是ACE Studio × StepFun 联合开源基于混合架构设计,支持50+语言演唱、精细化风格控制及多维度音频编辑,通过少量歌曲LoRA微调即可实现个性化风格迁移,兼顾专业性、高效性与易用性。

ACE StudioStepFun开源音乐生成模型
玄武CLI:清昴智能开源国产大模型部署工具,国产芯片专属一键部署
玄武CLI:清昴智能开源国产大模型部署工具,国产芯片专属一键部署

玄武CLI(xw-cli)是清昴智能开源的国产大模型专属部署工具,针对华为昇腾、沐曦、燧原等国产芯片深度优化,依托自动硬件检测、智能引擎调度能力,实现零复杂配置一键启动模型服务。

GitHub仓库国产AI大模型清昴智能
SoulX-FlashTalk:Soul App开源14B实时数字人生成模型,亚秒级延迟赋能商业级数字人应用

SoulX-FlashTalk是Soul App旗下AI团队开源的首款14B参数实时数字人生成模型,实现0.87秒亚秒级延迟、32fps高帧率输出,凭借双向流式蒸馏与多步自纠正核心机制,达成无限时长稳定生成、全身动作交互及多语言驱动能力。

Soul App开源数字人生成框架
Qwen3-Coder-Next:阿里开源的MoE架构编程智能体模型

Qwen3-Coder-Next是一款专为编程智能体与本地开发设计的开源权重语言模型。该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。

AI编程智能体MoE模型Qwen3基础架构通义千问
Thinker:优必选开源具身智能视觉语言大模型 专为机器人场景打造
Thinker:优必选开源具身智能视觉语言大模型 专为机器人场景打造

Thinker模型聚焦机器人核心需求,打造任务规划、空间理解、时间推理、视觉定位四大核心能力,精准解决机器人“想得到但抓不准”的行业痛点。模型基于20亿原始数据精炼的1000万高质量数据训练,依托自动化标注体系将人工参与率控制在1%以下,兼顾训练效率与数据质量。

AI视觉语言模型GitHub仓库
GLM-OCR:智谱AI开源轻量级多模态OCR模型0.9B参数登顶OmniDocBench SOTA
GLM-OCR:智谱AI开源轻量级多模态OCR模型0.9B参数登顶OmniDocBench SOTA

GLM-OCR是智谱AI开源的轻量级多模态OCR模型,模型基于GLM-V架构打造,集成智谱自研CogViT视觉编码器与轻量跨模态连接层,创新引入多Token预测损失和强化学习训练策略,在手写体、复杂表格、代码文档、印章、多语言混排等高难识别场景表现卓越。

GitHub仓库OCR模型多模态AI模型智谱AI
Grok Imagine 1.0:马斯克xAI最新推出的AI视频生成工具
Grok Imagine 1.0:马斯克xAI最新推出的AI视频生成工具

支持生成10秒长、720p分辨率的高清视频,搭配显著优化的音频效果,体验更流畅沉浸。上线30天内,该工具已累计生成超过12.45亿条视频,在Artificial Analysis基准测试中表现优异,且xAI已开放API接口,方便开发者灵活接入使用。

AI视频生成工具xAI公司马斯克
Ultralytics官网:一个轻量化开源计算机视觉与AI深度学习框架
Ultralytics官网:一个轻量化开源计算机视觉与AI深度学习框架

Ultralytics是一款易用性极强的开源计算机视觉(CV)与深度学习框架,框架覆盖从数据准备到模型部署的全流程,兼具“高性能、易上手、多端适配”三大核心优势,广泛应用于工业、安防、智能驾驶等多领域场景。

AI开源项目AI深度学习框架人工智能模型
Trae:新一代免费的AI编程工具