
Ming-omni-tts模型通过统一连续音频Tokenizer与Diffusion Transformer架构,以12.5Hz帧率处理多模态音频,并借助「Patch-by-Patch」压缩策略将LLM推理帧率降至3.1Hz,在保证高音质的同时大幅降低延迟。

Ming-omni-tts核心依托团队自研技术,采用12.5Hz连续分词器,搭配逐块压缩技术,在坚守高音质输出的基础上,大幅提升推理效率,推理帧率可低至3.1Hz,有效降低延迟。同时,模型具备强劲的文本正则化能力,能够准确、自然地朗读复杂数学公式与化学方程式,完美适配专业内容播报、教育科普等对文本解析要求较高的场景。

Ring-2.5-1T是蚂蚁集团推出的全球首个万亿参数混合线性注意力开源思维模型,核心实现“想得深、推得快、做得久”;模型开源且轻量化,重新定义万亿参数模型的性能边界,为通用人工智能体研发奠定关键基础。

蚂蚁集团基于百灵大模型打造的国内首款服务型AI原生生活管家,以自然对话交互为核心,打通生活服务全链路,帮助用户高效完成出行、消费、办事等日常任务,同时提供个性化场景推荐与生活咨询服务。

EchoMimic可将静态人像转化为表情丰富、动作流畅的动态视频。相较于SadTalker、MuseTalk等同类型工具,EchoMimic在动画自然度与细节可控性上实现显著突破,适用于虚拟主播、视频编辑、数字人交互等多元场景。

百灵大模型是蚂蚁集团推出的官方Web交互平台,支持体验Ling-1T、Ring-1T等核心模型,兼具高速响应与复杂推理能力;平台原生搭载图片、音频识别等多模态功能,同时打通开源生态、提供OpenAI兼容API。

Ming-UniAudio构建了端到端语音语言模型,精准平衡语音生成与语义理解性能;搭配扩散头技术,保障语音合成的高自然度与高还原度。尤为突出的是,模型首创指令引导的自由形式语音编辑框架,支持复杂的语义与声学修改,无需手动标定编辑区域,大幅降低操作门槛。

Ling-1T是蚂蚁集团重磅推出的万亿参数级开源语言模型,定位为“旗舰级非思考模型”。依托先进的 MoE(Mixture of Experts)混合专家架构,模型总参数量高达 1 万亿,推理时仅激活约 510 亿参数,在兼顾极致性能的同时大

用户通过简单对话指令即可创建睡眠计算器、倒计时工具等实用闪应用,搭配多端同步、收藏管理、文档整理等功能,以简洁界面承载强大能力,适配健康管理、日常办公、学习辅助等多元场景。

蚂蚁集团推出的AI医疗健康应用,用户提供全面的健康咨询服务,能对各类医疗图片如报告、病例、处方、药盒等进行精准解读,帮助用户更好地理解自身健康状况。

灵光是蚂蚁集团2025年11月18日正式发布的全模态通用AI助手,被内部定为AGI战略级C端产品,承接“AIFirst”转型目标,主打“让复杂变简单”。
Ring-1T-preview是蚂蚁集团于2025年9月30日凌晨在HuggingFace上线的预览版大模型,也是目前全球首个开源的万亿参数自然语言推理模型。

Neovate Code支持多种流行模型(如 OpenAI、Anthropic 等),可通过插件系统灵活扩展功能。目前以 CLI 工具形式提供,未来将适配更多客户端形态,满足不同开发场景需求。

语雀是一款专业的云端知识库和在线文档编辑与协同工具,以其优雅高效的功能,助力企业轻松搭建文档中心。语雀支持主流Office文件格式,提供多人协同编辑功能,帮助团队轻松构建知识库。

AQ是由蚂蚁集团开发和运营的一款独立的AI医疗健康应用,为用户提供全面的医疗健康服务,包括健康咨询、图片解读、个人和家庭健康档案管理、预约挂号、云陪诊等。