
Xiaomi MiMo-V2-Omni是小米推出的全模态Agent基座大模型,从底层融合文本、视觉、语音三大模态,原生具备感知、推理、执行一体化能力,支持工具调用、GUI操作与复杂任务自主规划,音频理解、图像推理等能力比肩Gemini 3 Pro与Claude Opus 4.6。

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

MiniCPM-o 4.5是面壁智能开源的9B参数全模态旗舰模型,该模型具备领先的视觉理解、超拟人语音生成及声音克隆能力,支持主动交互与实时流媒体处理,可在端侧设备运行,已适配昇腾、海光等多种国产芯片,通过llama.cpp、vLLM等框架实现高效部署。