
即梦AI(原名Dreamina)是由字节跳动旗下的剪映团队推出的一款一站式AI创作平台。其核心功能包括文生图(文字生成图像)、文/图生视频(文字或图片生成视频)以及智能画布等。

字节旗下AI代码助手程,国内首款原生AI IDE,它不仅提供智能代码生成、优化和调试功能,还通过多模态交互、上下文感知和跨语言支持等创新技术,帮助开发者高效完成项目开发。

Open-o3 Video是北京大学与字节跳动联合研发的开源视频推理模型,核心突破在于通过整合关键时间戳、边界框等显式时空证据,实现对视频内容的精准推理。

OmniVinci是NVIDIA推出的新一代全模态大语言模型,专注于视觉、听觉、语言与推理的跨模态协同任务。该模型依托独创的`OmniAlignNet`跨模态语义对齐技术、`Temporal Embedding Grouping`时序同步机制与`Constrained Rotary Time Embedding`时间感知优化方案

AI Research Foundations是Google DeepMind与伦敦大学学院联合打造的免费在线课程,聚焦Transformer模型的核心原理与实践应用,旨在帮助学习者夯实AI研究基础,掌握现代语言模型的构建、训练与微调全流程技能。

Ouro是字节跳动Seed团队联合多家机构研发的循环语言模型,其名称源自象征循环与自迭代的“衔尾蛇”。该模型突破传统语言模型“预训练+微调”的能力构建范式,通过在潜在空间的迭代计算,将推理能力直接融入预训练阶段。

Socost是一个主要收录了大量日系风格的手绘插图。这些插图通常具有可爱、温馨或日常生活化的特色,广泛应用于网站设计、PPT制作、印刷品、商业广告等领域。

SAIL-Embedding是由字节跳动抖音SAIL团队与香港中文大学MMLab联合研发的全模态嵌入基础模型,该模型支持文本、视觉、音频等任意模态输入,可生成统一且高信息量的特征表示,赋能多模态检索、分类、推荐等核心任务。

FG-CLIP 2是360推出的新一代开源双语细粒度视觉语言对齐模型,模型凭借创新的层次化对齐架构与动态注意力机制,在29项权威基准测试中超越Google SigLIP 2、Meta MetaCLIP 2等主流模型,跻身全球顶尖视觉语言模型行列。

不少农行卡用户会疑惑,为何自己频繁收到来自【10690955998】的短信,甚至误以为办卡就会默认被这类信息“打扰”。事实上,该号码是农业银行的【官方短信通道】,但发送的并非银行卡余额变动等基础服务提醒,而是“额度提升提示”“账户长期未登录提醒”等营销类短信。下面小编给大家简单介绍一下如何关闭!

星火教师助手是科大讯飞依托星火认知大模型打造的AI备课与教学辅助工具,聚焦教育场景的全流程需求,通过智能生成、资源检索、互动赋能三大核心能力,帮助教师简化备课流程、丰富教学形式、提升教学效率,是教育数字化转型的轻量化解决方案。

OpenWork是一款面向知识工作者的开源桌面应用程序,提供类Claude Cowork风格的自动化工作流解决方案。该应用以简洁的引导式操作界面为核心,支持本地与远程双模式运行,既能满足个人自动化任务需求,也可适配团队协作场景,是知识工作者提升工作效率的轻量化工具。

Sonic-3是Cartesia推出的新一代实时语音交互引擎,该引擎突破传统技术框架,在低延迟交互、多语言覆盖、智能上下文理解等核心能力上实现重大突破,同时提供灵活部署与企业级安全保障,赋能多领域语音交互场景创新。

Firefly Image 5是Adobe推出的新一代图像生成模型,凭借原生400万像素高分辨率输出、精细化人物渲染、智能图层编辑等核心能力,为创意工作者提供高效、灵活的生成式创作解决方案。

Music 2.0是MiniMax全新推出的智能音乐创作模型,可精准捕捉并还原人声的细腻情绪与器乐的动态张力,支持流行、爵士、摇滚等多元曲风自由切换,轻松实现男女对唱、阿卡贝拉等丰富演唱效果。

LTX-2是Lightricks研发的先进AI视频生成模型,专为专业级高质量视频创作打造。该模型可原生输出4K分辨率、50fps帧率的电影级视频,支持文字、图片、草图多模态输入,并提供镜头角度、物体动作、时间节奏等精细化控制能力。
