web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. Chrome插件
  8. 地图大全
  9. 休息站

AI项目和框架

Ouro:字节跳动Seed团队联合多家机构研发的循环语言模型
Ouro:字节跳动Seed团队联合多家机构研发的循环语言模型

Ouro是字节跳动Seed团队联合多家机构研发的循环语言模型,其名称源自象征循环与自迭代的“衔尾蛇”。该模型突破传统语言模型“预训练+微调”的能力构建范式,通过在潜在空间的迭代计算,将推理能力直接融入预训练阶段。

Seed团队字节跳动框架循环语言模型
SAIL-Embedding:SAIL团队和MMLab联合开发的全模态嵌入基础模型
SAIL-Embedding:SAIL团队和MMLab联合开发的全模态嵌入基础模型

SAIL-Embedding是由字节跳动抖音SAIL团队与香港中文大学MMLab联合研发的全模态嵌入基础模型,该模型支持文本、视觉、音频等任意模态输入,可生成统一且高信息量的特征表示,赋能多模态检索、分类、推荐等核心任务。

字节跳动抖音SAIL团队智能基础模型
FG-CLIP 2:360推出的新一代开源双语细粒度视觉语言对齐模型
FG-CLIP 2:360推出的新一代开源双语细粒度视觉语言对齐模型

FG-CLIP 2是360推出的新一代开源双语细粒度视觉语言对齐模型,模型凭借创新的层次化对齐架构与动态注意力机制,在29项权威基准测试中超越Google SigLIP 2、Meta MetaCLIP 2等主流模型,跻身全球顶尖视觉语言模型行列。

360开源AI视觉语言模型
OpenWork:开源AI桌面工作流平台,自动化平台技术文档
OpenWork:开源AI桌面工作流平台,自动化平台技术文档

OpenWork是一款面向知识工作者的开源桌面应用程序,提供类Claude Cowork风格的自动化工作流解决方案。该应用以简洁的引导式操作界面为核心,支持本地与远程双模式运行,既能满足个人自动化任务需求,也可适配团队协作场景,是知识工作者提升工作效率的轻量化工具。

AI工作流平台AI桌面智能体
Sonic-3模型:一款Cartesia推出的实时语音对话模型
Sonic-3模型:一款Cartesia推出的实时语音对话模型

Sonic-3是Cartesia推出的新一代实时语音交互引擎,该引擎突破传统技术框架,在低延迟交互、多语言覆盖、智能上下文理解等核心能力上实现重大突破,同时提供灵活部署与企业级安全保障,赋能多领域语音交互场景创新。

语音AI引擎语音对话模型
Firefly Image 5:Adobe官网推出的最新AI图像生成模型
Firefly Image 5:Adobe官网推出的最新AI图像生成模型

Firefly Image 5是Adobe推出的新一代图像生成模型,凭借原生400万像素高分辨率输出、精细化人物渲染、智能图层编辑等核心能力,为创意工作者提供高效、灵活的生成式创作解决方案。

Adobe模型AI图像生成模型
Music 2.0:MiniMax推出新一代智能音乐创作模型
Music 2.0:MiniMax推出新一代智能音乐创作模型

Music 2.0是MiniMax全新推出的智能音乐创作模型,可精准捕捉并还原人声的细腻情绪与器乐的动态张力,支持流行、爵士、摇滚等多元曲风自由切换,轻松实现男女对唱、阿卡贝拉等丰富演唱效果。

MiniMax视频音乐创作模型
LTX-2:Lightricks旗舰级/电影级多模态AI视频生成模型
LTX-2:Lightricks旗舰级/电影级多模态AI视频生成模型

LTX-2是Lightricks研发的先进AI视频生成模型,专为专业级高质量视频创作打造。该模型可原生输出4K分辨率、50fps帧率的电影级视频,支持文字、图片、草图多模态输入,并提供镜头角度、物体动作、时间节奏等精细化控制能力。

AI视频生成模型Lightricks电影级AI
LongCat-Video:美团开源136亿参数高效AI长视频生成模型
LongCat-Video:美团开源136亿参数高效AI长视频生成模型

LongCat-Video是美团LongCat团队研发的136亿参数开源AI视频生成模型,支持文本到视频(Text-to-Video)、图像到视频(Image-to-Video)及视频续写(Video-Continuation)全任务流程,核心优势在于高效生成高质量长视频。

AI视频生成模型图像转视频文本转视频美团AI美团开源
豆包视频生成1.0 Pro Fast:火山引擎高效AI视频生成利器
豆包视频生成1.0 Pro Fast:火山引擎高效AI视频生成利器

豆包视频生成1.0 Pro Fast是火山引擎推出的高效型AI视频生成模型。该模型在承袭上一代技术底座优势的基础上,实现生成速度最高提升3倍、成本直降72%的双重突破,同时支持视频时长、帧数、分辨率的精准可控。

AI视频生成器火山引擎豆包大模型
混元世界模型 1.5:腾讯开源秒级推理3D世界生成引擎

混元世界模型1.5(HunyuanWorld-Mirror)是腾讯推出的开源3D世界生成模型,支持多视图图像、视频等多模态输入,可同步输出点云、深度图、相机参数、表面法线、3D高斯点等多样化3D几何预测结果。

3D世界生成模型混元大模型腾讯开源
Seed3D 1.0:字节跳动单图生成高精度3D模型的创新引擎
Seed3D 1.0:字节跳动单图生成高精度3D模型的创新引擎

Seed3D 1.0是字节跳动Seed团队研发的3D生成大模型,支持从单张图像直接生成高精度3D模型,凭借高保真资产生成、物理引擎深度兼容、可扩展场景组合三大核心优势,为3D内容生产、物理仿真、具身智能训练等领域提供高效解决方案。

3D生成大模型字节跳动框架
Baichuan-M2 Plus:百川智能推出的循证增强型医疗大模型,开启可信医疗AI新阶段
Baichuan-M2 Plus:百川智能推出的循证增强型医疗大模型,开启可信医疗AI新阶段

Baichuan-M2 Plus是百川智能推出的循证增强医疗大模型,该模型首创六源循证推理(EAR)范式,融合PICO智能检索技术与循证强化训练机制,通过整合六层权威医疗证据,从根源上降低模型幻觉率,大幅提升回答的可信度与专业性。

Baichuan-M2医疗AI软件医疗大模型百川智能
豆包语音2.0:字节跳动推出的新一代多能力AI语音交互模型
豆包语音2.0:字节跳动推出的新一代多能力AI语音交互模型

豆包语音2.0是字节跳动推出的升级版AI语音模型,该模型包含三大核心组件:Doubao-Seed-ASR-2.0、Doubao-Seed-TTS 2.0和Doubao-Seed-ICL 2.0,从“听得准、说得好、仿得像”三大维度全面升级。

AI语音模型字节跳动框架豆包大模型
豆包大模型 1.6 Lite:字节跳动推出轻量高效的企业级AI解决方案
豆包大模型 1.6 Lite:字节跳动推出轻量高效的企业级AI解决方案

豆包大模型1.6 Lite是字节跳动推出的轻量级企业级人工智能模型,相较于旗舰版豆包1.6,它在保持核心能力的基础上实现了更精简的体积、更快的推理速度和更高的性价比。

企业级AI字节跳动豆包大模型轻量级AI模型
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具