DynamicCity是一款专注于生成具有语义信息的动态 LiDAR 场景,能够处理大规模空间(80×80×6.4 m³)和长序列(最多 128 帧)的数据。该框架通过在潜空间显式建模场景的空间布局与动态变化,并借助扩散模型直接生成高质量的动态场景。
Bild AI 使用人工智能读取建筑蓝图,并自动生成详细的材料清单和成本估算。这一功能显著提高了估算效率,减少了人工操作的时间和错误率。
Solana Agent Kit是一个用于连接 AI 智能体到 Solana 协议的开源工具包。现在,任何使用 Deepseek LLM 的智能体都可以自主执行 60+ 种 Solana 操作:
DeepSearcher 结合强大的 LLM(DeepSeek、OpenAI 等)和向量数据库(Milvus 等),根据私有数据进行搜索、评估和推理,提供高度准确的答案和全面的报告。
AutoFlow 是一个开源的基于 GraphRAG 的知识库工具,构建于 TiDB Vector、LlamaIndex 和 DSPy 之上。提供类 Perplexity 的搜索页面,并可以嵌入简单的 JavaScript 代码片段,轻松将 Autoflow 的对话式搜索窗口集成到您的网站。
RAGFlow是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
CLaMP 3 是由清华大学推出的多模态、多语言音乐信息检索框架,支持文本到音乐、图像到音乐检索及零样本音乐分类等功能。它基于对比学习技术,可将乐谱、音频和文本对齐到共享语义空间,支持27种语言,并泛化到100种语言,适用于跨模态检索和音乐推荐任务。
瑞智病理大模型(RuiPath)由瑞金医院与华为联合发布,是临床级国产多模态互动式病理大模型。它融合多模态数据,覆盖常见癌种及罕见病,诊断准确率高达90%以上,单切片诊断仅需数秒,显著提升病理诊断效率。
ATTPs一个用于Agent之间可信通信的基础协议框架,基于DeekSeek的Agent,可以接入ATTPs的SDK,获得注册Agent,发送可验证数据,获取可验证数据等功能,从而与其他平台的Agent进行可信通信。
We0是一款开源的AI代码编辑器,支持多种现代开发框架,包括 Vue、React、Next.js、Python、Java 以及微信小程序。
LLaDA是由中国人民大学高瓴人工智能研究院与蚂蚁集团联合推出的一种新型扩散语言模型。该模型通过正向掩码和反向预测机制,突破了传统自回归语言模型的限制,显著提升了语言生成和理解能力。
YoMo通过其强大的功能和灵活的架构,为开发者提供了一个理想的选择,用于构建低延迟、地理分布式的 AI 应用和边缘计算解决方案。
argo是一款支持本地下载并运行Huggingface及Ollama模型,支持RAG、LLM API、工具接入等,支持Mac/Windows/Linux。
Anda一个专为 AI 智能体开发设计的 Rust 语言框架,致力于构建高度可组合、自主运行且具备永久记忆能力的 AI 智能体网络。
一个故事短视频生成工具,能够根据用户输入的故事主题快速生成包含 AI 生成图像、故事内容、音频和字幕的高清视频。
STranslate遵循“即开即用、即用即走”的设计理念,旨在为用户提供快速便捷的翻译和文字识别服务。该工具完全开源且免费,支持多种翻译引擎和 OCR 功能,适用于 Windows 操作系统。
Bob 是一款 macOS 平台的翻译和 OCR 软件,您可以在任何应用程序中使用 Bob 进行翻译和 OCR,即用即走!为 macOS 用户提供了一个高效、便捷的工具,适用于日常学习、工作和阅读外文资料。
LiberSonora是一个工具集,包含智能字幕提取、AI标题生成、多语言翻译等功能,支持 GPU 加速、批量离线处理!
Wordware 通过其强大的功能和直观的界面,为 AI 开发提供了一种高效、低门槛的解决方案,适合各种规模的组织和个人使用。
浙江大学推出的 DeepSeek 系列专题线上公开课 是一项旨在深入解析 DeepSeek 技术革新、应用前景及其对社会发展影响的教育活动。