web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

AI项目和框架

豆包网页版支持AI聊天,AI图片生成,AI漫画生成,AI写作等
[推荐] 豆包网页版:支持AI聊天,AI图片生成,AI漫画生成,AI写作等

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

AI写作平台AI图片生成AI漫画生成工具AI聊天助手
Mistral AI:欧洲开源大模型标杆企业,提供了增强的推理、理解和概括
Mistral AI:欧洲开源大模型标杆企业,提供了增强的推理、理解和概括

Mistral AI与OpenAI、Google等同业巨头一致,Mistral AI专注于大型语言模型研发,其技术成果可为ChatGPT、Gemini等对话机器人提供核心动力。但区别于头部企业的闭源路线,Mistral AI坚定奉行开源开放战略,通过免费开放模型代码与权重,降低开发者门槛,助力用户快速构建定制化对话机器人。

AI平台模型AI科技公司人工智能大模型
美图AI视觉大模型:一款聚焦美学创作的专业AI视觉大模型
美图AI视觉大模型:一款聚焦美学创作的专业AI视觉大模型

美图MiracleVision奇想智能是一款聚焦美学创作的专业AI视觉大模型,终端用户仅需输入提示词,或搭配图片素材,即可借助美图自研算法模型生成精美图像,并支持多风格定制与精细化画面控制,轻松实现 “所想即所得” 的创作体验。

AI平台模型AI智能图生图AI智能文生图AI视觉大模型美图AI
新壹视频大模型:国内首款聚焦视频AIGC领域的专业语言大模型
新壹视频大模型:国内首款聚焦视频AIGC领域的专业语言大模型

新壹视频大模型是国内首个专注于视频AIGC赛道的语言大模型,覆盖视频脚本生成、素材智能匹配、原生 AI 视频生成、声音克隆、智能剪辑、数字人播报等关键环节,实现视频创作的端到端智能化。

AI声音克隆AI平台模型AI视频生成AI语言大模型数字人播报智能剪辑平台
猎户星空 Orion-14B 系列大模型:高性能多语种通用智能基座
猎户星空 Orion-14B 系列大模型:高性能多语种通用智能基座

猎户星空Orion-14B系列是一套面向多场景的140亿参数级多语种大模型,基于2.5万亿tokens多样化语料训练,全面覆盖中、英、日、韩等主流语言,在多语言任务与公开基准评测中表现卓越,多项核心指标显著超越同参数规模模型。

AI平台模型多语种大模型
智源悟道大模型:北京智源自主研发的新一代通用人工智能基座
智源悟道大模型:北京智源自主研发的新一代通用人工智能基座

悟道大模型是北京智源人工智能研究院(BAAI)自主研发的通用人工智能大模型,目标是在自然语言处理及多模态智能领域达到并超越国际先进水平。

AI平台模型人工智能大模型北京智源
MotionGen:元象基于物理的3D动作生成模型,文本指令秒变逼真动作
MotionGen:元象基于物理的3D动作生成模型,文本指令秒变逼真动作

MotionGen是元象推出的基于物理的3D动作生成模型,用户只需输入简单文本指令,即可快速生成逼真、流畅且复杂的3D角色动作,彻底解决传统3D动作设计中效率低、成本高、依赖手工制作或昂贵动作捕捉设备的行业痛点。

3D动作3D模型生成AI文本生成工具
GPT智库:安全合规的全球顶尖AI综合应用平台
GPT智库:安全合规的全球顶尖AI综合应用平台

平台集成智能对话、文生图、图生图、音频翻译、图像分析、全球学术资料搜索等多元功能,为科研院所、新闻媒体、高校、政府部门等机构及个人用户,提供安全、合规、可控的全球一流人工智能服务。

AI平台模型AI应用平台AI智能对话AI音视频处理
DeepTutor:港大开源多智能体AI学习助手,将任何文档转化为互动学习体验
DeepTutor:港大开源多智能体AI学习助手,将任何文档转化为互动学习体验

用户上传教科书、论文、技术手册等各类文档后,系统可自动构建专属知识库,通过可视化解析、智能问答等方式助力深度理解;同时提供个性化学习路径规划,大幅缩短学习周期、提升知识留存率,是学习者与程序员的高效知识加速器。

AI学习助手多智能体框架香港大学
Nemotron Speech ASR:英伟达开源低延迟流式语音识别模型,24毫秒实现单句转录锁定

Nemotron Speech ASR是英伟达推出的开源实时流式语音识别模型,专为低延迟语音交互场景打造。依托创新的缓存感知架构,模型可缓存已处理语音特征,仅对新音频帧执行增量计算,实现单句转录锁定仅需24毫秒,彻底解决传统流式模型在长语音识别中的累积延迟难题。

英伟达语音识别模型
光语大模型:无限光年自研多模态可信大模型,精准赋能金融/医疗垂直领域
光语大模型:无限光年自研多模态可信大模型,精准赋能金融/医疗垂直领域

光语大模型是无限光年推出的融合大语言模型与符号推理的多模态AI大模型,深度整合视觉与语言处理技术,由视觉编码器、视觉特征适配器、大语言模型三大核心模块构成,配备10亿视觉模型参数+130亿语言模型参数。

AI平台模型医疗大模型金融大模型
星流Star-3 Alpha:Liblibai自研图像大模型,重新定义创意视觉生产力
星流Star-3 Alpha:Liblibai自研图像大模型,重新定义创意视觉生产力

星流图像大模型(Star-3 Alpha)是由Liblibai重磅发布的自研图像生成模型,基于业界领先的F.1基础算法架构训练打造,辅以全球最大的LoRA增强模型库与持续进化的AI图像控制能力。

AI图像生成大模型AI绘画生成器Liblibai
面壁智能:聚焦大模型技术创新,让通用AI普惠千万企业
面壁智能:聚焦大模型技术创新,让通用AI普惠千万企业

面壁智能是一家专注于人工智能大模型技术创新与应用落地的科技企业,公司以“智周万物”为愿景,致力于打造安全、普惠的通用人工智能,依托开源社区构建大规模预训练模型库与配套工具,加速百亿级以上大模型的训练、微调与推理,让AI技术真正惠及千万家企业。

AI科技公司
TangoFlux:SUTD × NVIDIA联合研发文本转音频模型,3.7秒生成高质量立体声音频

TangoFlux是由新加坡科技设计大学与 NVIDIA 联合研发的先进文本到音频生成模型。模型搭载约5.15亿参数,具备高效生成能力——在单张A40 GPU上,仅需3.7秒即可生成一段长达30秒的44.1kHz立体声音频。

AI平台模型nvidia文字转语音新加坡科技设计大学
Kiln AI:开源LLM全流程工具,零代码搞定微调、数据生成与团队协作
Kiln AI:开源LLM全流程工具,零代码搞定微调、数据生成与团队协作

Kiln AI是一款面向开发者与研究者的开源大型语言模型(LLM)全流程工具,核心覆盖模型微调、合成数据生成、数据集协作三大核心能力。它提供直观的可视化操作界面,全兼容Windows、MacOS、Linux系统,支持零代码方式完成多类模型微

AI平台模型零代码AI
星辰Agent开发平台:讯飞星火新一代智能体开发平台,快速搭建生产级智能体
星辰Agent开发平台:讯飞星火新一代智能体开发平台,快速搭建生产级智能体

平台提供全栈式Agent开发引擎、两大类开发模板、生产级大模型核心组件、全链路效果定制工具链及全生态模型兼容架构,支持提示词、工作流两种智能体创建方式,创建后的智能体可发布至个人专属渠道、讯飞星火App、微信公众号、专属API、MCP Server等,适配多场景集成与定制需求。

AI平台模型AI智能体讯飞AI
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具