
mHC是DeepSeek团队研发的新型神经网络架构设计方法,直击传统超连接架构在大规模训练中稳定性不足的核心痛点,为超大规模模型的高效训练与性能突破提供了创新性解决方案。

IQuest-Coder-V1是IQuestLab推出的专注于代码生成、理解和优化的先进人工智能模型,支持分组查询注意力(GQA)机制,原生支持128K上下文长度,能高效处理长代码片段和复杂工程上下文。40B参数的Loop版本通过循环/递归式架构,进一步优化了模型容量与部署效率。

AutoMV实现了从音频、歌词到完整音乐视频的端到端生成,凭借高效、低成本、高质量的核心优势,为音乐视频创作领域提供了全新解决方案。

Tencent-HY-MT1.5是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持33种国际语言互译及5种民汉/方言翻译,覆盖多种小语种。

PersonaLive是澳门大学和GVC实验室开源的实时数字人直播工具,能在单张12GB显存的消费级显卡上运行,实现无限时长的肖像动画生成,支持低延迟互动。
Doubao-Seed-Code是火山引擎发布的豆包编程模型,作为国内首个“视觉理解+长上下文+低成本”三位一体的代码大模型,它重新定义了AI辅助编程的效率与边界。

TurboDiffusion是由清华大学、生数科技与加州大学伯克利分校联合研发的重磅视频生成加速框架,凭借多项核心技术突破,实现视频生成效率的跨越式提升。框架创新性融合SageAttention、SLA(稀疏线性注意力)与rCM(时间步蒸馏
MedASR支持根据特定医疗场景需求进一步微调优化。通过将医学语音高效转化为结构化文本,MedASR为医疗领域数字化应用搭建核心技术支撑,助力提升医疗服务效率与智能化水平。

Kairos 3.0是开源的高效世界基础模型,专注于学习真实世界的动态、因果关系和物理规律,通过长时序视频生成实现对世界的理解和预测。
VTP是MiniMax 视频团队研发的开源视觉生成模型预训练框架,核心聚焦视觉tokenizer的深度优化,通过融合对比学习、自监督学习与重建学习等多元训练范式,从头预训练出更具结构化、易学性的latent表示。
山海大模型是云知声公司推出的一款多模态AI大模型,具备丰富的知识储备和强大的多模态交互能力。它能够通过文本、音频、图像等多种形式与用户进行实时互动,提供信息查询、知识学习、灵感激发等服务。

SHARP是苹果推出的开源AI模型,专注于单张2D照片到3D场景的高效生成,为VR/AR、影视制作、文物保护等领域提供低成本、高效率的3D建模解决方案。

SAM Audio是Meta开源的音频分割模型,能通过文本、视觉和时间片段等多模态提示,从复杂的音频混合中分离出特定的声音。

TRELLIS.2支持完整PBR材质建模,在NVIDIA H100 GPU上3秒即可生成512³分辨率模型,最高支持1536³超高清输出,同时提供GLB标准格式导出,为游戏、影视、工业设计等领域提供低成本、高效率的3D内容创作解决方案。

支持PDF、Word、Excel、PowerPoint、Markdown等多种文件格式,能精准捕获关键见解、图表和数据点。用户可以选择内置的专业主题,也可以用自然语言描述来生成自定义样式。
