web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

语音转文本

Genspark Speakly:AI语音听写应用,将语音转化为清晰规范的文本
Genspark Speakly:AI语音听写应用,将语音转化为清晰规范的文本

Genspark Speakly是一款高效AI语音听写应用,支持多语言混合识别,搭载AI自动编辑、自定义指令、代理模式等强大功能,为各类大文字量输入场景提供高效解决方案,是写作、办公、学习等领域的专业语音输入助手。

AI听写应用AI语音听写语音转文本
豆包网页版支持AI聊天,AI图片生成,AI漫画生成,AI写作等
[推荐] 豆包网页版:支持AI聊天,AI图片生成,AI漫画生成,AI写作等

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

AI写作平台AI图片生成AI漫画生成工具AI聊天助手
PPWord:支持多种语言的文本生成、图片生成、音乐创作和视频制作

PPWord是一个国内领先的AI应用网站,专注于ChatGPT技术的落地与创新。它不仅支持多种语言的文本生成、图片生成、音乐创作和视频制作,还涵盖了从个人助手到专业领域的广泛应用。

图像生成文本生成聊天机器人语音转文本
OpenAI推出的2个模型:GPT-4o mini TTS和GPT-4o-transcribe

今天OpenAI推出的2个AI大模型,它们分别是文本转语音模型GPT-4o mini TTS,一个是语音转文本模型GPT-4o-transcribe,下面web建站小编给大家简单介绍一下它们的功能特点及应用场景!

OpenAI开发文本转语音语音转文本
FastRTC:Hugging Face推出的Python实时通信库,简化音频和视频流开发
FastRTC:Hugging Face推出的Python实时通信库,简化音频和视频流开发

FastRTC是由 Hugging Face 开发的开源Python实时通信库,它通过简化 WebRTC 和 WebSocket 的开发流程,提供了自动语音检测、轮流发言、自动 UI 支持和语音实用工具集成等功能。

HuggingfacePython通信库WebSocket低代码开发文本转语音语音转文本
Scribe:ElevenLabs推出的高精度语音转文本模型,支持99种语言
Scribe:ElevenLabs推出的高精度语音转文本模型,支持99种语言

Scribe 是由 ElevenLabs 开发的最新语音转文本模型,以其卓越的转录准确率(英语高达96.7%,意大利语高达98.7%)和强大的多语言支持脱颖而出。它能够识别多达32位不同说话者,并检测非语言事件,如笑声和背景噪音。

AI录音工具AI音频工具语音转文本
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具