SpatialLM是由群核科技开源的一款专为三维空间理解设计的大型语言模型,生成物理正确的3D场景布局,并输出结构化的场景理解结果。它在具身智能训练、机器人导航、建筑设计、教育研究、智能家居等多个领域展现出强大的应用潜力,为三维空间理解带来了新的突破。
序列猴子是由出门问问开发的超大规模语言模型,具备强大的多模态生成能力,支持文本、图像、语音等多种模态的输入和输出。它能够处理长文本序列,支持多轮对话,提供高质量的语言生成和图像创作功能。
TokenSwift 是一个创新的AI框架,专为加速超长文本生成任务而设计。它通过多Token并行生成、动态KV缓存更新和上下文惩罚策略,显著提升了生成效率,实现90分钟内生成10万Token,相比传统方法提速3倍以上。
LLM4AD 是一个基于大语言模型(LLM)的开源平台,专注于自动驾驶和算法设计的创新。通过模块化设计和统一接口,LLM4AD 提供了灵活的开发框架,支持从优化任务到机器学习、科学发现和工程设计的广泛应用。
一个基于大型语言模型的多智能体框架,专注于构建高效、灵活且可扩展的智能体系统。它通过强大的协同模式(如PEER和DOE)和领域经验融合能力,帮助开发者快速搭建智能体,提升复杂任务的处理效率。
BFS-Prover 是由字节跳动豆包大模型团队推出的一款基于大语言模型(LLM)的自动定理证明系统。它通过改进广度优先搜索(BFS)算法,结合专家迭代和直接偏好优化(DPO)技术,实现了高效的证明搜索。
Huginn 通过其独特的推理机制和高效计算能力,为语言模型的推理能力带来了新的突破。它不仅在复杂任务中表现出色,还通过开源架构为社区提供了进一步探索和扩展的可能性。
Meteora是由南京大学计算机科学与技术系研究团队开发的一种大型语言模型(LLM),它通过其创新的架构和高效的推理策略,显著提升了大语言模型在多任务场景中的性能和灵活性,是当前 AI 领域的一个重要研究方向。
Moonlight-16B-A3B是由 MoonshotAI(月之暗面)开发的一种混合专家(MoE)模型,具有160亿总参数和30亿激活参数。该模型使用了改进版的 Muon 优化器进行训练,显著提升了计算效率和性能。
阿里国际开源Ovis2系列多模态大语言模型,涵盖1B到34B六个版本,性能卓越!34B版本在多模态通用能力榜单中超越众多70B旗舰模型,数学推理和视频理解能力领先。开源代码已上线GitHub,Hugging Face和Modelscope可直接下载,快来体验!
SignLLM是全球首个通过文字描述生成手语视频的多语言手语模型,该模型支持8种手语类型,包括美国手语等。它基于首个公开的多语言手语数据集 Prompt2Sign 开发,能够将输入的文本或语音指令转换为手语手势视频。
Doubao-1.5-pro模型使用 MoE 架构,并通过训练-推理一体化设计,探索模型性能和推理性能之间的极致平衡。Doubao-1.5-pro 仅用较小激活参数,即可超过一流超大稠密预训练模型的性能,并在多个评测基准上取得优异成绩。
LLaDA是由中国人民大学高瓴人工智能研究院与蚂蚁集团联合推出的一种新型扩散语言模型。该模型通过正向掩码和反向预测机制,突破了传统自回归语言模型的限制,显著提升了语言生成和理解能力。
一款由360 AI 研究院和中山大学联合开发的高效扩散变换器模型,旨在实现从文本到任意任务的高效转换。该模型采用了创新的代理令牌技术,通过稀疏的代表token注意力机制来优化视觉信息的处理,从而提高计算效率和生成效果。
一款基于全科医学通用大语言模型,能24小时在线解答健康问题,提供类似三甲医院专家的建议。 用户可以通过拍照上传化验单或体检报告,好伴AI会快速解读指标,分析潜在健康问题,结合用户历史数据提供个性化建议。
Long-VITA是由腾讯优图实验室、南京大学和厦门大学一起提出的一种大型多模态模型,能够在长上下文视觉语言理解任务中提供卓越的性能和广泛的应用潜力。
通古大模型是由华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)开发的一款专注于古籍理解和处理的大语言模型。
Matrix-Zero是昆仑万维公司推出的一款创新性人工智能世界模型,旨在探索3D场景生成与可交互视频生成的前沿技术。
一款由DeepSeek AI公司开发的多功能人工智能工具,其功能特点和应用场景涵盖了多个领域,包括自然语言处理、深度学习、数据分析、图像识别、代码生成等。