web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用
即梦AI:文生图、文生视频,解锁创作新境界
[推荐] 即梦AI:文生图、文生视频,解锁创作新境界

即梦AI(原名Dreamina)是由字节跳动旗下的剪映团队推出的一款一站式AI创作平台。其核心功能包括文生图(文字生成图像)、文/图生视频(文字或图片生成视频)以及智能画布等。

AI创意平台AI图片编辑AI智能画布AI绘画AI视频生成
Trae – AI编程IDE安装插件
Trae – AI编程IDE安装插件

字节旗下AI代码助手程,国内首款原生AI IDE,它不仅提供智能代码生成、优化和调试功能,还通过多模态交互、上下文感知和跨语言支持等创新技术,帮助开发者高效完成项目开发。

AI代码生成AI编程助手代码编辑器字节跳动
CoF:DeepMind 提出的视频模型时空推理新范式
CoF:DeepMind 提出的视频模型时空推理新范式

CoF是DeepMind推出的视觉推理新概念,类比语言模型领域的链式思维技术。这一范式赋予视频模型跨时间与空间的推理能力,通过逐帧生成连贯视频序列的方式,解决复杂视觉任务。

AI项目和框架DeepMind视觉模型
Manzano:苹果推出的统一图像理解与生成多模态大语言模型
Manzano:苹果推出的统一图像理解与生成多模态大语言模型

Manzano是苹果公司研发的新型多模态大语言模型,核心突破在于实现图像理解与图像生成的能力统一。模型创新性采用混合视觉分词器,将图像同步转化为两类特征表示:用于理解任务的连续嵌入向量,以及用于生成任务的离散图像标记。

AI项目和框架AI图像生成模型苹果AI
Sora 2:OpenAI新一代多模态音视频生成模型
Sora 2:OpenAI新一代多模态音视频生成模型

Sora 2是OpenAI推出的新一代AI音视频生成模型,该模型实现三大核心技术突破:依托多模态联合训练,首次达成环境音效与画面动态的实时同步生成。

AI项目和框架AI视频生成模型AI音频生成OpenAI开发
Moras:全球首款全自动商业Agentic AI工具,赋能内容电商高效变现
Moras:全球首款全自动商业Agentic AI工具,赋能内容电商高效变现

Moras是全球首款全自动商业Agentic AI工具,聚焦TikTok平台的创作者与个体商家,通过AI算法驱动的智能选品、自动化视频创作与商业数据分析能力,帮助用户快速产出高质量带货视频,实现内容电商的高效变现。

IT知识AI内容创作工具AI电商变现
Logics-Parsing:阿里巴巴开源的多模态端到端文档解析模型
Logics-Parsing:阿里巴巴开源的多模态端到端文档解析模型

Logics-Parsing是阿里巴巴推出的开源端到端文档解析模型,基于多模态大模型Qwen2.5-VL-7B构建。该模型创新融合监督微调与布局中心型强化学习技术,攻克复杂文档的结构解析与内容理解难题。

AI项目和框架文档解析模型阿里巴巴
Tinker API:面向语言模型微调的极简开发与托管平台
Tinker API:面向语言模型微调的极简开发与托管平台

Tinker API提供`forward_backward`、`sample`等底层操作原语,支持开发者灵活构建自定义微调或强化学习算法;兼容从小型到超大参数量的全品类开放权重模型,模型切换仅需修改代码中一个字符串参数。

AI项目和框架AI语言模型LoRA模型
LONGLIVE:英伟达联合研发的实时交互式长视频生成框架
LONGLIVE:英伟达联合研发的实时交互式长视频生成框架

LONGLIVE是英伟达等顶尖机构联合推出的实时交互式长视频生成框架,针对长视频生成的效率与质量双重瓶颈,创新融合帧级自回归模型、KV-recache机制、流式长视频微调技术及短窗口注意力+帧汇入策略,构建起高性能的长视频生成链路。

IT知识英伟达视频生成框架
xLLM:京东开源的国产芯片适配型高效智能推理框架
xLLM:京东开源的国产芯片适配型高效智能推理框架

xLLM可广泛适配大语言模型、多模态模型及生成式推荐等多类场景,能够提供高性能、低成本的推理服务,助力智能客服、实时推荐、内容生成等业务高效落地,推动大语言模型在国产芯片生态上的规模化应用。

AI项目和框架京东AI智能推理框架
Meta ARE:Meta出品,面向AI Agents的动态模拟研究与评估平台
Meta ARE:Meta出品,面向AI Agents的动态模拟研究与评估平台

Meta ARE是Meta推出的专业研究平台,聚焦于AI Agents的训练与系统性评估。该平台通过构建随时间动态演变的模拟环境,还原真实世界的复杂多步骤任务场景,要求Agents能够根据新信息的出现和环境条件的变化,实时调整决策策略。

AI项目和框架Agents评估Meta AI
FireRedChat:小红书智创音频团队自研全双工智能语音交互系统
FireRedChat:小红书智创音频团队自研全双工智能语音交互系统

FireRedChat是小红书智创音频团队打造的全双工语音交互系统,系统采用高灵活性的模块化架构,涵盖转录控制模块、交互模块、对话管理器等核心组件,支持级联与半级联两种部署模式,可按需适配不同业务场景。

AI项目和框架小红书语音交互系统
TRUEBench:三星电子面向真实场景的AI生产力基准测试工具
TRUEBench:三星电子面向真实场景的AI生产力基准测试工具

TRUEBench是三星电子推出的AI基准测试工具,聚焦人工智能在实际工作场景中的生产力评估,针对性解决现有AI基准测试的核心局限性,例如以英语为中心的单一语言覆盖、局限于单轮问答的简单任务结构等问题。

AI项目和框架AI性能测试AI测试工具三星AI
GLM-4-32B:智谱新一代开源基座大模型,支持HTML/CSS/JS/SVG等语言
GLM-4-32B:智谱新一代开源基座大模型,支持HTML/CSS/JS/SVG等语言

GLM-4-32B是智谱推出的新一代开源基座模型,参数版本为GLM-4-32B-0414。该模型基于15T高质量数据完成预训练,重点强化代码生成、逻辑推理与工程任务处理能力,支持HTML、CSS、JS、SVG等多类语言的实时代码展示与运行。

AI项目和框架基座大模型智谱AI
Step-Audio-R1.1:阶跃星辰开源原生语音推理模型
Step-Audio-R1.1:阶跃星辰开源原生语音推理模型

Step-Audio-R1.1是阶跃星辰推出的全球首个开源原生语音推理模型。该模型凭借96.4% 的超高准确率登顶全球权威语音推理榜单,性能全面超越业界众多一线模型。

AI项目和框架语音推理模型阶跃星辰
献丑AI:首个AI视频开源社区,全流程创作工具赋能多元创作
献丑AI:首个AI视频开源社区,全流程创作工具赋能多元创作

平台覆盖电商营销、品牌宣传、影视创作等多元场景,适配从零基础新手到资深创作者的全人群需求,能让每个人的创意理念结构化、精准视觉化呈现,最终构建有深度、可沉淀的创作者生态。

AI项目和框架Agent助手AI开源社区AI视频工具AI音频生成无限画布
Typeless:AI语音输入工具,高效转录+精准润色提升创作与办公效率
Typeless:AI语音输入工具,高效转录+精准润色提升创作与办公效率

Typeless是一款主打效率提升与表达优化的创新AI语音输入工具,支持100多种语言及混合语言输入,可自动检测并转录,适应不同场景的语气和风格,无论是工作邮件还是日常聊天,能智能调整文本风格。

IT知识AI办公工具AI效率提升AI语音输入
Trae:新一代免费的AI编程工具