web建站教程

  1. 首页
  2. vuejs
  3. js
  4. 好玩
  5. AIGC工具
  6. 前端知识
  7. 百度echarts
  8. 更多
    php入门
    nodejs
    mockjs
    reactjs
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    手机应用

IT知识

Finer-CAM:精准定位图像关键特征,图像更精准,分类更清晰!

Finer-CAM适用于需要高精度图像解释的领域,如生物分类(区分相似物种)、细粒度图像分类(如汽车型号识别)以及多模态零样本学习任务。例如,在鸟类识别中,Finer-CAM能够精准定位鸟类的独特特征,如红脚鹬的脚趾。

AI图像处理AI图片处理
LanPaint:一款无需额外训练的图像修复工具
LanPaint:一款无需额外训练的图像修复工具

LanPaint(原名Lama Cleaner)是一款免费、开源且完全可自托管的AI图像修复工具,该工具基于最新的SOTA(State-of-the-Art)人工智能技术,利用先进的AI模型(如LaMa、MAT、Stable Diffusion Inpainting等)提供高质量的图像处理功能。

AI图片修复stable-diffusion-webui
可灵AI解锁三大AI特效:FuzzyFuzzy、MochiMochi和BoomBoom

可灵AI推出三大AI特效:FuzzyFuzzy(毛绒风格)、MochiMochi(Q弹捏捏乐)和BoomBoom(膨胀漂浮)。用户上传图片,即可一键生成生动有趣的动态视频,实现毛绒化、捏动或膨胀漂浮效果。这些特效操作简单,趣味性强,为创意视频制作带来全新体验。

AI图生视频AI大模型AI文生视频AI视频续写可灵AI
Gumloop:零代码AI自动化平台,轻松构建高效工作流
Gumloop:零代码AI自动化平台,轻松构建高效工作流

Gumloop是一个AI驱动的零代码工作流平台,用户可以通过简单的拖放操作创建和部署复杂的自动化工作流程,无需编写代码。无论是个人用户还是企业用户,都可以通过简单的拖放操作实现复杂任务的自动化,从而节省时间和提高生产力。

AI开发框架无代码AI
腾讯混元3D:支持搭建3D基模型+3D功能矩阵+3D生成工作流+创作素材库
腾讯混元3D:支持搭建3D基模型+3D功能矩阵+3D生成工作流+创作素材库

腾讯混元3D是一款由腾讯推出的全球首个支持文字和图像生成3D模型的开源AI平台,旨在通过AI技术简化3D内容创作流程,提升创作效率和质量。

3D人物生成3D动画生成3D模型生成3D游戏AI图像工具腾讯云AI
Character-3模型:一款由Hedra Studio推出的AI数字人视频生成模型
Character-3模型:一款由Hedra Studio推出的AI数字人视频生成模型

Character-3是由Hedra Studio推出的多模态AI数字人模型,能够将图像、文本和音频联合推理,生成栩栩如生的动态角色视频。它支持全身动作捕捉、情感控制和多样化角色生成,可快速制作高质量视频。

AI数字人视频生成模型
Duck.ai:一款免费、匿名的AI聊天机器人,无需用户注册账!
Duck.ai:一款免费、匿名的AI聊天机器人,无需用户注册账!

Duck.ai是一款注重隐私保护的AI聊天机器人,通过匿名化处理和严格的隐私政策,为用户提供了一个安全的对话平台。它支持多种高性能AI模型,并提供免费使用服务,适合需要隐私保护的用户。

AI模型AI聊天机器人
autoMate:AI与RPA结合,打造本地自动化新体验
autoMate:AI与RPA结合,打造本地自动化新体验

autoMate是一款AI本地自动化工具,其核心功能包括机器人流程自动化(RPA)、API调用、UI自动化测试等,适用于桌面和云端环境中的自动化任务。autoMate支持自定义扩展,可以通过插件扩展其功能,从而促进组织内部效率的提升。

AI自动化工具RPA工具无代码AI
Cardamon:AI合规自动化平台,助力企业高效应对监管挑战
Cardamon:AI合规自动化平台,助力企业高效应对监管挑战

Cardamon是AI合规平台,能够快速将复杂的法规文本转化为企业具体的合规义务,将原本需要数月的工作量缩短至几分钟。支持多司法管辖区的法规,包括英国FCA、欧盟MiFID、美国SEC等。

AI助手AI合规平台
Audacity 3.7:一款免费开源的音频编辑软件,支持 Windows/MacOS等主流操作系统
Audacity 3.7:一款免费开源的音频编辑软件,支持 Windows/MacOS等主流操作系统

Audacity是一款免费开源的音频编辑软件,以其强大的功能、开源免费的特性以及跨平台支持,成为音频编辑领域的热门选择。无论是专业音频工程师还是普通用户,都可以通过这款软件实现高质量的音频处理和创作。

应用软件开源软件效率工具音频编辑
Word在线编辑器:一款无需安装任何软件即可打开和编辑Word文档
Word在线编辑器:一款无需安装任何软件即可打开和编辑Word文档

在Word在线编辑器中选择您的Word DOCX文档,轻松在线编辑您的Word文档并将图像、文本和评论添加转Word文件中!

PDF处理工具PDF编辑器Word编辑器
Chikka.ai:一款专注于客户访谈的AI平台
Chikka.ai:一款专注于客户访谈的AI平台

Chikka.ai 是一款智能AI语音访谈平台,通过模拟专业访谈者与受访者对话,快速收集反馈并生成分析报告。支持多语言、个性化访谈计划和团队协作,确保隐私安全,助力企业高效洞察客户需求,优化决策。

AI平台AI语音
URO-Bench:一款功能强大且灵活的AI基准测试工具

URO-Bench是一个面向端到端语音对话模型(SDMs)的全面基准测试工具。它是首个涵盖多语言、多轮对话及副语言信息的基准测试,旨在填补语音对话模型在语音到语音(Speech-to-Speech, S2S)场景下缺乏全面评估的空白。

AI模型AI测试工具
PopAi:一款集成了多种强大功能的 AI 助手
PopAi:一款集成了多种强大功能的 AI 助手

PopAi是一款功能全面且易于使用的AI工具平台,适合学生、教育工作者、专业作家、SEO专家、社交媒体经理等多种用户群体。通过其多样化的功能和强大的技术支持,PopAi能够显著提升用户的生产力和创造力。

AI图像生成工具AI聊天机器人DeepSeekPDF文档
Raycast AI Extensions:动动嘴就能操控电脑,开启高效生产力新体验
Raycast AI Extensions:动动嘴就能操控电脑,开启高效生产力新体验

Raycast AI Extensions是一款强大的桌面生产力工具,通过自然语言交互技术让用户无需打开应用程序即可完成任务。它支持多扩展集成,能够同时调用多个工具完成复合任务,如安排会议、生成任务和管理日程。

AI增强扩展AI辅助工具
IndexTTS:一款出自B站的开源级工业级高效文本转语音(TTS)系统
IndexTTS:一款出自B站的开源级工业级高效文本转语音(TTS)系统

IndexTTS是由B站开源的工业级文本转语音(TTS)系统,专为高效、可控的语音合成而设计。它支持中文多音字纠正、音质优化和零样本语音克隆,采用先进的Conformer编码器和BigVGAN2解码器,显著提升了音质和推理速度。

AI语音B站出品文本转语音
FLORA节点式AI画布:一款创意工作流的革命性工具

FLORA是一款创新的节点式AI画布工具,专为创意专业人士设计,能够简化从故事分析到视觉内容生成的整个创意流程。它采用拖放式界面,支持团队实时协作,提供丰富的预建节点和模板库,帮助用户高效生成角色设计、镜头提示和视觉内容。

AI工作流AI画布
FastRTC:Hugging Face推出的Python实时通信库,简化音频和视频流开发
FastRTC:Hugging Face推出的Python实时通信库,简化音频和视频流开发

FastRTC是由 Hugging Face 开发的开源Python实时通信库,它通过简化 WebRTC 和 WebSocket 的开发流程,提供了自动语音检测、轮流发言、自动 UI 支持和语音实用工具集成等功能。

HuggingfacePython通信库WebSocket低代码开发文本转语音语音转文本
悟空浏览器正式接入 DeepSeek R1 模型,开启智能浏览新时代
悟空浏览器正式接入 DeepSeek R1 模型,开启智能浏览新时代

字节跳动旗下的悟空浏览器于2025年2月27日正式接入 DeepSeek R1 模型,标志着其在C端产品中大规模应用AI技术的开端。DeepSeek R1 是一款高性能的满血高速版模型,支持智能对话、文本生成和多语言推理,能够显著提升用户体验。

DeepSeek字节跳动悟空浏览器
Scribe:ElevenLabs推出的高精度语音转文本模型,支持99种语言
Scribe:ElevenLabs推出的高精度语音转文本模型,支持99种语言

Scribe 是由 ElevenLabs 开发的最新语音转文本模型,以其卓越的转录准确率(英语高达96.7%,意大利语高达98.7%)和强大的多语言支持脱颖而出。它能够识别多达32位不同说话者,并检测非语言事件,如笑声和背景噪音。

AI录音工具AI音频工具语音转文本