web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

AI项目和框架

Firefly Image 5:Adobe官网推出的最新AI图像生成模型
Firefly Image 5:Adobe官网推出的最新AI图像生成模型

Firefly Image 5是Adobe推出的新一代图像生成模型,凭借原生400万像素高分辨率输出、精细化人物渲染、智能图层编辑等核心能力,为创意工作者提供高效、灵活的生成式创作解决方案。

Adobe模型AI图像生成模型
Music 2.0:MiniMax推出新一代智能音乐创作模型
Music 2.0:MiniMax推出新一代智能音乐创作模型

Music 2.0是MiniMax全新推出的智能音乐创作模型,可精准捕捉并还原人声的细腻情绪与器乐的动态张力,支持流行、爵士、摇滚等多元曲风自由切换,轻松实现男女对唱、阿卡贝拉等丰富演唱效果。

MiniMax视频音乐创作模型
LTX-2:Lightricks旗舰级/电影级多模态AI视频生成模型
LTX-2:Lightricks旗舰级/电影级多模态AI视频生成模型

LTX-2是Lightricks研发的先进AI视频生成模型,专为专业级高质量视频创作打造。该模型可原生输出4K分辨率、50fps帧率的电影级视频,支持文字、图片、草图多模态输入,并提供镜头角度、物体动作、时间节奏等精细化控制能力。

AI视频生成模型Lightricks电影级AI
LongCat-Video:美团开源136亿参数高效AI长视频生成模型
LongCat-Video:美团开源136亿参数高效AI长视频生成模型

LongCat-Video是美团LongCat团队研发的136亿参数开源AI视频生成模型,支持文本到视频(Text-to-Video)、图像到视频(Image-to-Video)及视频续写(Video-Continuation)全任务流程,核心优势在于高效生成高质量长视频。

AI视频生成模型图像转视频文本转视频美团AI美团开源
豆包视频生成1.0 Pro Fast:火山引擎高效AI视频生成利器
豆包视频生成1.0 Pro Fast:火山引擎高效AI视频生成利器

豆包视频生成1.0 Pro Fast是火山引擎推出的高效型AI视频生成模型。该模型在承袭上一代技术底座优势的基础上,实现生成速度最高提升3倍、成本直降72%的双重突破,同时支持视频时长、帧数、分辨率的精准可控。

AI视频生成器火山引擎豆包大模型
混元世界模型 1.5:腾讯开源秒级推理3D世界生成引擎

混元世界模型1.5(HunyuanWorld-Mirror)是腾讯推出的开源3D世界生成模型,支持多视图图像、视频等多模态输入,可同步输出点云、深度图、相机参数、表面法线、3D高斯点等多样化3D几何预测结果。

3D世界生成模型混元大模型腾讯开源
Seed3D 1.0:字节跳动单图生成高精度3D模型的创新引擎
Seed3D 1.0:字节跳动单图生成高精度3D模型的创新引擎

Seed3D 1.0是字节跳动Seed团队研发的3D生成大模型,支持从单张图像直接生成高精度3D模型,凭借高保真资产生成、物理引擎深度兼容、可扩展场景组合三大核心优势,为3D内容生产、物理仿真、具身智能训练等领域提供高效解决方案。

3D生成大模型字节跳动框架
Baichuan-M2 Plus:百川智能推出的循证增强型医疗大模型,开启可信医疗AI新阶段
Baichuan-M2 Plus:百川智能推出的循证增强型医疗大模型,开启可信医疗AI新阶段

Baichuan-M2 Plus是百川智能推出的循证增强医疗大模型,该模型首创六源循证推理(EAR)范式,融合PICO智能检索技术与循证强化训练机制,通过整合六层权威医疗证据,从根源上降低模型幻觉率,大幅提升回答的可信度与专业性。

Baichuan-M2医疗AI软件医疗大模型百川智能
豆包语音2.0:字节跳动推出的新一代多能力AI语音交互模型
豆包语音2.0:字节跳动推出的新一代多能力AI语音交互模型

豆包语音2.0是字节跳动推出的升级版AI语音模型,该模型包含三大核心组件:Doubao-Seed-ASR-2.0、Doubao-Seed-TTS 2.0和Doubao-Seed-ICL 2.0,从“听得准、说得好、仿得像”三大维度全面升级。

AI语音模型字节跳动框架豆包大模型
豆包大模型 1.6 Lite:字节跳动推出轻量高效的企业级AI解决方案
豆包大模型 1.6 Lite:字节跳动推出轻量高效的企业级AI解决方案

豆包大模型1.6 Lite是字节跳动推出的轻量级企业级人工智能模型,相较于旗舰版豆包1.6,它在保持核心能力的基础上实现了更精简的体积、更快的推理速度和更高的性价比。

企业级AI字节跳动豆包大模型轻量级AI模型
RTFM:李飞飞团队推出的实时生成式世界模型,实时生成3D场景
RTFM:李飞飞团队推出的实时生成式世界模型,实时生成3D场景

RTFM是李飞飞团队研发的实时生成式世界模型,支持3D场景的实时生成与持久化用户交互。该模型摒弃传统物理渲染的复杂流程,通过学习海量视频数据中的光影、材质与空间关系,将物理渲染问题转化为数据驱动的感知问题。

3D场景李飞飞团队
Coral NPU:谷歌推出的面向低功耗边缘设备的全栈开源AI平台
Coral NPU:谷歌推出的面向低功耗边缘设备的全栈开源AI平台

Coral NPU是谷歌推出的全栈开源边缘AI计算平台,专为智能手表、AR眼镜等低功耗边缘设备打造,核心解决边缘场景下的AI性能瓶颈、硬件碎片化、用户隐私保护三大关键挑战。

全栈开源AI平台谷歌AI
PaddleOCR-VL:百度飞桨开源的轻量化多模态文档解析开源模型
PaddleOCR-VL:百度飞桨开源的轻量化多模态文档解析开源模型

PaddleOCR-VL是百度飞桨团队推出的轻量级多模态文档解析模型,参数量仅0.9B,专为低算力设备部署优化。该模型在国际权威评测OmnidocBench V1.5中以 92.6分斩获全球第一,性能超越GPT-4o等主流模型。

文档解析模型百度开源百度飞桨
DeepSeek-OCR:DeepSeek团队开源的高效长文本视觉语言处理模型
DeepSeek-OCR:DeepSeek团队开源的高效长文本视觉语言处理模型

DeepSeek-OCR是DeepSeek团队研发的一款视觉语言模型,主打基于视觉压缩技术的长文本高效处理能力。该模型采用DeepEncoder编码器+DeepSeek3B-MoE解码器的架构,可在保留高分辨率输入信息的前提下,大幅降低激活内存占用与视觉标记数量。

AI视觉语言模型DeepSeek模型
MAI-Image-1:微软推出的首款自研图像生成式AI模型
MAI-Image-1:微软推出的首款自研图像生成式AI模型

MAI-Image-1是微软推出的首款自研图像生成式AI模型,专攻逼真自然光照效果与复杂场景的生成,尤其擅长还原闪电、风景等对光影细节要求极高的画面。

AI图像生成大模型AI模型评测微软AI生成式AI模型
Trae:新一代免费的AI编程工具