web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用
即梦AI:文生图、文生视频,解锁创作新境界
[推荐] 即梦AI:文生图、文生视频,解锁创作新境界

即梦AI(原名Dreamina)是由字节跳动旗下的剪映团队推出的一款一站式AI创作平台。其核心功能包括文生图(文字生成图像)、文/图生视频(文字或图片生成视频)以及智能画布等。

AI创意平台AI图片编辑AI智能画布AI绘画AI视频生成
Trae – AI编程IDE安装插件
Trae – AI编程IDE安装插件

字节旗下AI代码助手程,国内首款原生AI IDE,它不仅提供智能代码生成、优化和调试功能,还通过多模态交互、上下文感知和跨语言支持等创新技术,帮助开发者高效完成项目开发。

AI代码生成AI编程助手代码编辑器字节跳动
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架

DiaMoE-TTS是清华大学与巨人网络联合研发的多方言语音合成框架,框架创新性采用国际音标统一输入体系,融合方言感知的混合专家(MoE)架构与低资源适配策略,实现低成本、低门槛的多方言语音合成。

AI项目和框架GitHub仓库多方言TTS框架巨人网络清华大学
UserLM-8b:微软新一代专属用户角色模拟语言模型
UserLM-8b:微软新一代专属用户角色模拟语言模型

UserLM-8b是微软重磅推出的专属用户角色模拟语言模型,该模型依托WildChat-1M等大规模真实对话数据集完成深度训练,能够精准复刻真实用户的语言风格与交互逻辑,生成高度贴近现实场景的对话内容。

AI项目和框架对话模拟模型微软开源模型
KAT-Dev-72B-Exp:快手开源编程大模型,重塑软件工程生产力
KAT-Dev-72B-Exp:快手开源编程大模型,重塑软件工程生产力

KAT-Dev-72B-Exp是快手重磅推出的开源编程专用大语言模型,作为KAT-Coder的强化学习升级版,该模型深度聚焦软件工程全流程任务,凭借卓越性能在权威基准测试中脱颖而出——在SWE-Bench Verified测试中,准确率高达74.6%,充分彰显技术硬实力。

AI项目和框架AI编程模型快手开源
Qwen3-VL Cookbooks:阿里出品的Qwen3-VL多模态模型实战指南集
Qwen3-VL Cookbooks:阿里出品的Qwen3-VL多模态模型实战指南集

Qwen3-VL Cookbooks是阿里巴巴为Qwen3-VL多模态大模型量身打造的官方实战指南集合,指南覆盖物体识别、文档解析、视频理解、3D定位等十余类核心能力,每一份Cookbook均配套详细代码示例、分步操作教程与场景化最佳实践。

AI项目和框架GitHub仓库Qwen3-VL阿里云AI
Paper2Video:新加坡国立大学一键将学术论文转化为专业演示视频
Paper2Video:新加坡国立大学一键将学术论文转化为专业演示视频

Paper2Video是新加坡国立大学Show Lab研发的学术论文视频化工具依托创新的PaperTalker多智能体框架,实现从学术论文到完整演示视频的全自动生成。

AI项目和框架多智能体框架学术论文新加坡国立大学
MineContext:字节跳动开源主动式上下文感知的AI工具

MineContext是字节跳动推出的开源主动式上下文感知AI工具,创新性提出“数字生活方块挖掘”理念,帮助用户高效管理分散的知识与信息资产。

AI项目和框架AI工具GitHub仓库上下文处理字节开源
LLaVA-OneVision-1.5:Lab开源的高性能低成本开源多模态模型
LLaVA-OneVision-1.5:Lab开源的高性能低成本开源多模态模型

LLaVA-OneVision-1.5在多模态权威基准测试中表现优异,且全链条技术资源透明开放,代码、数据与模型权重一键获取,助力开发者低成本复现与二次创新。

AI项目和框架AI多模态模型Lab开源
SAIL-VL2:抖音 × 新加坡国立大学联合开源的视觉语言模型
SAIL-VL2:抖音 × 新加坡国立大学联合开源的视觉语言模型

SAIL-VL2是抖音团队与新加坡国立大学联合研发的开源视觉语言基础模型,模型由SAIL-ViT视觉编码器、视觉-语言适配器与大语言模型三大核心模块构成,创新性采用渐进式训练框架,从视觉预训练、多模态融合,到最终的SFT-RL混合范式优化,实现性能阶梯式跃升。

AI项目和框架AI视觉语言模型抖音AI新加坡国立大学
Get Jobs:开源简历投递自动化工具,多平台高效求职利器
Get Jobs:开源简历投递自动化工具,多平台高效求职利器

Get Jobs是一款开源自动化简历投递工具,专为求职者打造高效求职解决方案。工具支持Boss直聘、猎聘、拉勾、51job、智联招聘等主流招聘平台。

AI项目和框架AI简历GitHub仓库
Ming-UniAudio:蚂蚁集团推出的开源音频多模态大模型
Ming-UniAudio:蚂蚁集团推出的开源音频多模态大模型

Ming-UniAudio构建了端到端语音语言模型,精准平衡语音生成与语义理解性能;搭配扩散头技术,保障语音合成的高自然度与高还原度。尤为突出的是,模型首创指令引导的自由形式语音编辑框架,支持复杂的语义与声学修改,无需手动标定编辑区域,大幅降低操作门槛。

AI项目和框架蚂蚁集团音频多模态模型
上头蛙:腾讯打造的微信生态沉浸式AI互动剧情创作平台
上头蛙:腾讯打造的微信生态沉浸式AI互动剧情创作平台

上头蛙是腾讯推出的微信小程序互动剧情平台,平台覆盖二次元、悬疑、恐怖、情感等多元热门题材,深度结合头部IP二创内容,精准触达年轻用户群体。

IT知识AI创作平台剧情创作平台微信小程序腾讯AI
FLUX.2 [klein]:Black Forest Labs开源的高效图像生成与编辑模型
FLUX.2 [klein]:Black Forest Labs开源的高效图像生成与编辑模型

FLUX.2 [klein]是Black Forest Labs推出的开源高效图像生成与编辑模型,凭借突破性的架构设计与优化技术,实现0.5秒内完成高质量图像生成与编辑的亚秒级推理速度,支持文生图、图生图及多参考生成三大核心功能。

AI项目和框架AI图像生成大模型图像编辑模型
TranslateGemma:谷歌Gemma 3生态力作,多模态开源翻译模型
TranslateGemma:谷歌Gemma 3生态力作,多模态开源翻译模型

TranslateGemma是谷歌基于Gemma 3大模型架构推出的新一代开源翻译模型系列,该模型提供4B、12B、27B三种参数规模版本,分别适配移动设备、消费级笔记本、云端高性能计算平台,真正做到全场景灵活部署。

AI项目和框架多语言翻译模型谷歌开源
Ling-1T:蚂蚁集团开源万亿参数旗舰模型,高效推理引领开源第一梯队
Ling-1T:蚂蚁集团开源万亿参数旗舰模型,高效推理引领开源第一梯队

Ling-1T是蚂蚁集团重磅推出的万亿参数级开源语言模型,定位为“旗舰级非思考模型”。依托先进的 MoE(Mixture of Experts)混合专家架构,模型总参数量高达 1 万亿,推理时仅激活约 510 亿参数,在兼顾极致性能的同时大

AI项目和框架大型语言模型蚂蚁集团
Gemini 2.5 Computer Use:让AI自主操控浏览器的智能自动化工具
Gemini 2.5 Computer Use:让AI自主操控浏览器的智能自动化工具

Gemini 2.5 Computer Use是谷歌DeepMind基于Gemini 2.5大模型打造的智能计算机操作模型,突破性实现AI对浏览器的直接控制,可自主执行点击、滚动、输入等交互动作。依托强大的视觉理解与逻辑推理能力,模型能精准

AI项目和框架AI自动化工具DeepMindGemini谷歌AI
Trae:新一代免费的AI编程工具