web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用
即梦AI:文生图、文生视频,解锁创作新境界
[推荐] 即梦AI:文生图、文生视频,解锁创作新境界

即梦AI(原名Dreamina)是由字节跳动旗下的剪映团队推出的一款一站式AI创作平台。其核心功能包括文生图(文字生成图像)、文/图生视频(文字或图片生成视频)以及智能画布等。

AI创意平台AI图片编辑AI智能画布AI绘画AI视频生成
Trae – AI编程IDE安装插件
Trae – AI编程IDE安装插件

字节旗下AI代码助手程,国内首款原生AI IDE,它不仅提供智能代码生成、优化和调试功能,还通过多模态交互、上下文感知和跨语言支持等创新技术,帮助开发者高效完成项目开发。

AI代码生成AI编程助手代码编辑器字节跳动
Seed3D 1.0:字节跳动单图生成高精度3D模型的创新引擎
Seed3D 1.0:字节跳动单图生成高精度3D模型的创新引擎

Seed3D 1.0是字节跳动Seed团队研发的3D生成大模型,支持从单张图像直接生成高精度3D模型,凭借高保真资产生成、物理引擎深度兼容、可扩展场景组合三大核心优势,为3D内容生产、物理仿真、具身智能训练等领域提供高效解决方案。

AI项目和框架3D生成大模型字节跳动框架
Baichuan-M2 Plus:百川智能推出的循证增强型医疗大模型,开启可信医疗AI新阶段
Baichuan-M2 Plus:百川智能推出的循证增强型医疗大模型,开启可信医疗AI新阶段

Baichuan-M2 Plus是百川智能推出的循证增强医疗大模型,该模型首创六源循证推理(EAR)范式,融合PICO智能检索技术与循证强化训练机制,通过整合六层权威医疗证据,从根源上降低模型幻觉率,大幅提升回答的可信度与专业性。

AI项目和框架Baichuan-M2医疗AI软件医疗大模型百川智能
豆包语音2.0:字节跳动推出的新一代多能力AI语音交互模型
豆包语音2.0:字节跳动推出的新一代多能力AI语音交互模型

豆包语音2.0是字节跳动推出的升级版AI语音模型,该模型包含三大核心组件:Doubao-Seed-ASR-2.0、Doubao-Seed-TTS 2.0和Doubao-Seed-ICL 2.0,从“听得准、说得好、仿得像”三大维度全面升级。

AI项目和框架AI语音模型字节跳动框架豆包大模型
豆包大模型 1.6 Lite:字节跳动推出轻量高效的企业级AI解决方案
豆包大模型 1.6 Lite:字节跳动推出轻量高效的企业级AI解决方案

豆包大模型1.6 Lite是字节跳动推出的轻量级企业级人工智能模型,相较于旗舰版豆包1.6,它在保持核心能力的基础上实现了更精简的体积、更快的推理速度和更高的性价比。

AI项目和框架企业级AI字节跳动豆包大模型轻量级AI模型
RTFM:李飞飞团队推出的实时生成式世界模型,实时生成3D场景
RTFM:李飞飞团队推出的实时生成式世界模型,实时生成3D场景

RTFM是李飞飞团队研发的实时生成式世界模型,支持3D场景的实时生成与持久化用户交互。该模型摒弃传统物理渲染的复杂流程,通过学习海量视频数据中的光影、材质与空间关系,将物理渲染问题转化为数据驱动的感知问题。

AI项目和框架3D场景李飞飞团队
Coral NPU:谷歌推出的面向低功耗边缘设备的全栈开源AI平台
Coral NPU:谷歌推出的面向低功耗边缘设备的全栈开源AI平台

Coral NPU是谷歌推出的全栈开源边缘AI计算平台,专为智能手表、AR眼镜等低功耗边缘设备打造,核心解决边缘场景下的AI性能瓶颈、硬件碎片化、用户隐私保护三大关键挑战。

AI项目和框架全栈开源AI平台谷歌AI
PaddleOCR-VL:百度飞桨开源的轻量化多模态文档解析开源模型
PaddleOCR-VL:百度飞桨开源的轻量化多模态文档解析开源模型

PaddleOCR-VL是百度飞桨团队推出的轻量级多模态文档解析模型,参数量仅0.9B,专为低算力设备部署优化。该模型在国际权威评测OmnidocBench V1.5中以 92.6分斩获全球第一,性能超越GPT-4o等主流模型。

AI项目和框架文档解析模型百度开源百度飞桨
DeepSeek-OCR:DeepSeek团队开源的高效长文本视觉语言处理模型
DeepSeek-OCR:DeepSeek团队开源的高效长文本视觉语言处理模型

DeepSeek-OCR是DeepSeek团队研发的一款视觉语言模型,主打基于视觉压缩技术的长文本高效处理能力。该模型采用DeepEncoder编码器+DeepSeek3B-MoE解码器的架构,可在保留高分辨率输入信息的前提下,大幅降低激活内存占用与视觉标记数量。

AI项目和框架AI视觉语言模型DeepSeek模型
MAI-Image-1:微软推出的首款自研图像生成式AI模型
MAI-Image-1:微软推出的首款自研图像生成式AI模型

MAI-Image-1是微软推出的首款自研图像生成式AI模型,专攻逼真自然光照效果与复杂场景的生成,尤其擅长还原闪电、风景等对光影细节要求极高的画面。

AI项目和框架AI图像生成大模型AI模型评测微软AI生成式AI模型
Youtu-Embedding:腾讯优图开源企业级通用文本表示模型
Youtu-Embedding:腾讯优图开源企业级通用文本表示模型

Youtu-Embedding是腾讯优图实验室重磅推出的开源企业级通用文本表示模型,依托大规模语料预训练与创新协同-判别式微调框架,构建起强大的语义理解能力,可一站式胜任文本检索、意图理解、相似度判断等六大核心任务。

AI项目和框架GitHub仓库企业级AI腾讯优图腾讯开源
Kandinsky 5.0:俄罗斯AI-Forever实验室旗舰文本到视频生成模型
Kandinsky 5.0:俄罗斯AI-Forever实验室旗舰文本到视频生成模型

Kandinsky 5.0是俄罗斯AI研究实验室AI-Forever研发的新一代文本到视频生成模型,兼具卓越生成质量与高效推理性能,在跨场景内容创作中展现出强劲竞争力。

AI项目和框架AI-Forever开源俄罗斯网站视频生成模型
FS-DFM:苹果 × 俄亥俄州立大学推出高效长文本生成的扩散语言模型
FS-DFM:苹果 × 俄亥俄州立大学推出高效长文本生成的扩散语言模型

FS-DFM是苹果公司联合俄亥俄州立大学研发的快速长文本生成扩散语言模型,核心突破在于将采样步数作为显式参数进行训练,实现了“少步数、高质量”的文本生成效果。

AI项目和框架俄亥俄州立大学扩散语言模型苹果AI
Veo 3.1:谷歌新一代AI视频生成模型,重构创意生产全流程
Veo 3.1:谷歌新一代AI视频生成模型,重构创意生产全流程

Veo 3.1是谷歌推出的旗舰级AI视频生成模型,支持文本提示、图像、视频片段等多模态输入,可直接生成720P、1080P乃至4K高清视频,让用户在生成阶段即可完成音画同步的完整创作,无需额外后期处理。

AI项目和框架AI视频生成模型谷歌AI
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架

DiaMoE-TTS是清华大学与巨人网络联合研发的多方言语音合成框架,框架创新性采用国际音标统一输入体系,融合方言感知的混合专家(MoE)架构与低资源适配策略,实现低成本、低门槛的多方言语音合成。

AI项目和框架GitHub仓库多方言TTS框架巨人网络清华大学
UserLM-8b:微软新一代专属用户角色模拟语言模型
UserLM-8b:微软新一代专属用户角色模拟语言模型

UserLM-8b是微软重磅推出的专属用户角色模拟语言模型,该模型依托WildChat-1M等大规模真实对话数据集完成深度训练,能够精准复刻真实用户的语言风格与交互逻辑,生成高度贴近现实场景的对话内容。

AI项目和框架对话模拟模型微软开源模型
Trae:新一代免费的AI编程工具