web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

AI项目和框架

豆包网页版支持AI聊天,AI图片生成,AI漫画生成,AI写作等
[推荐] 豆包网页版:支持AI聊天,AI图片生成,AI漫画生成,AI写作等

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

AI写作平台AI图片生成AI漫画生成工具AI聊天助手
Vidu Q2:生数科技重磅推出的新一代图生视频大模型
Vidu Q2:生数科技重磅推出的新一代图生视频大模型

Vidu Q2最新上线参考生图、文生图和图像编辑功能,旨在提高图像生成的一致性和实用性。模型提供一站式多参工作流,从参考生图到一键转主体,再到参考生视频,无需更换平台能完成整个创作过程。

图生视频模型生数科技
FLM-Audio:北京智源等联合开发的原生全双工音频对话大模型
FLM-Audio:北京智源等联合开发的原生全双工音频对话大模型

FLM-Audio是由北京智源人工智能研究院携手Spin Matrix、新加坡南洋理工大学联合研发的原生全双工音频对话大模型,全面支持中英双语交互,凭借突破性技术架构与训练范式,重新定义智能语音对话的自然流畅体验。

GitHub仓库Spin Matrix南洋理工大学智源研究院音频对话模型
Spark Chemistry-X1-13B:科大讯飞开源的化学专业大语言模型
Spark Chemistry-X1-13B:科大讯飞开源的化学专业大语言模型

Spark Chemistry-X1-13B是科大讯飞推出的化学领域专业大语言模型,依托讯飞星火X1-0420大模型基座构建,通过多类型化学任务数据集的定向微调,既具备卓越的复杂化学问题解决能力,又保留了通用大模型的灵活交互特性。

AI化学模型科大讯飞魔搭社区
GDPval:OpenAI研发推出的全新AI模型经济价值评估框架
GDPval:OpenAI研发推出的全新AI模型经济价值评估框架

GDPval是OpenAI研发的全新AI模型评估体系,核心目标是衡量AI模型在真实经济价值任务中的实际表现。该框架从对美国GDP贡献最大的9大行业中,筛选出44类典型知识型职业,针对性设计1320个真实工作任务,

AI经济模型AI评估框架OpenAI
CoF:DeepMind 提出的视频模型时空推理新范式
CoF:DeepMind 提出的视频模型时空推理新范式

CoF是DeepMind推出的视觉推理新概念,类比语言模型领域的链式思维技术。这一范式赋予视频模型跨时间与空间的推理能力,通过逐帧生成连贯视频序列的方式,解决复杂视觉任务。

DeepMind视觉模型
Manzano:苹果推出的统一图像理解与生成多模态大语言模型
Manzano:苹果推出的统一图像理解与生成多模态大语言模型

Manzano是苹果公司研发的新型多模态大语言模型,核心突破在于实现图像理解与图像生成的能力统一。模型创新性采用混合视觉分词器,将图像同步转化为两类特征表示:用于理解任务的连续嵌入向量,以及用于生成任务的离散图像标记。

AI图像生成模型苹果AI
Sora 2:OpenAI新一代多模态音视频生成模型
Sora 2:OpenAI新一代多模态音视频生成模型

Sora 2是OpenAI推出的新一代AI音视频生成模型,该模型实现三大核心技术突破:依托多模态联合训练,首次达成环境音效与画面动态的实时同步生成。

AI视频生成模型AI音频生成OpenAI开发
Logics-Parsing:阿里巴巴开源的多模态端到端文档解析模型
Logics-Parsing:阿里巴巴开源的多模态端到端文档解析模型

Logics-Parsing是阿里巴巴推出的开源端到端文档解析模型,基于多模态大模型Qwen2.5-VL-7B构建。该模型创新融合监督微调与布局中心型强化学习技术,攻克复杂文档的结构解析与内容理解难题。

文档解析模型阿里巴巴
Tinker API:面向语言模型微调的极简开发与托管平台
Tinker API:面向语言模型微调的极简开发与托管平台

Tinker API提供`forward_backward`、`sample`等底层操作原语,支持开发者灵活构建自定义微调或强化学习算法;兼容从小型到超大参数量的全品类开放权重模型,模型切换仅需修改代码中一个字符串参数。

AI语言模型LoRA模型
xLLM:京东开源的国产芯片适配型高效智能推理框架
xLLM:京东开源的国产芯片适配型高效智能推理框架

xLLM可广泛适配大语言模型、多模态模型及生成式推荐等多类场景,能够提供高性能、低成本的推理服务,助力智能客服、实时推荐、内容生成等业务高效落地,推动大语言模型在国产芯片生态上的规模化应用。

京东AI智能推理框架
Meta ARE:Meta出品,面向AI Agents的动态模拟研究与评估平台
Meta ARE:Meta出品,面向AI Agents的动态模拟研究与评估平台

Meta ARE是Meta推出的专业研究平台,聚焦于AI Agents的训练与系统性评估。该平台通过构建随时间动态演变的模拟环境,还原真实世界的复杂多步骤任务场景,要求Agents能够根据新信息的出现和环境条件的变化,实时调整决策策略。

Agents评估Meta AI
FireRedChat:小红书智创音频团队自研全双工智能语音交互系统
FireRedChat:小红书智创音频团队自研全双工智能语音交互系统

FireRedChat是小红书智创音频团队打造的全双工语音交互系统,系统采用高灵活性的模块化架构,涵盖转录控制模块、交互模块、对话管理器等核心组件,支持级联与半级联两种部署模式,可按需适配不同业务场景。

小红书语音交互系统
TRUEBench:三星电子面向真实场景的AI生产力基准测试工具
TRUEBench:三星电子面向真实场景的AI生产力基准测试工具

TRUEBench是三星电子推出的AI基准测试工具,聚焦人工智能在实际工作场景中的生产力评估,针对性解决现有AI基准测试的核心局限性,例如以英语为中心的单一语言覆盖、局限于单轮问答的简单任务结构等问题。

AI性能测试AI测试工具三星AI
GLM-4-32B:智谱新一代开源基座大模型,支持HTML/CSS/JS/SVG等语言
GLM-4-32B:智谱新一代开源基座大模型,支持HTML/CSS/JS/SVG等语言

GLM-4-32B是智谱推出的新一代开源基座模型,参数版本为GLM-4-32B-0414。该模型基于15T高质量数据完成预训练,重点强化代码生成、逻辑推理与工程任务处理能力,支持HTML、CSS、JS、SVG等多类语言的实时代码展示与运行。

基座大模型智谱AI
Step-Audio-R1.1:阶跃星辰开源原生语音推理模型
Step-Audio-R1.1:阶跃星辰开源原生语音推理模型

Step-Audio-R1.1是阶跃星辰推出的全球首个开源原生语音推理模型。该模型凭借96.4% 的超高准确率登顶全球权威语音推理榜单,性能全面超越业界众多一线模型。

语音推理模型阶跃星辰
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具