ClawWork是香港大学数据科学实验室(HKUDS)开源的AI Agent经济生存基准测试框架,核心用于评估大模型在真实商业环境中的“赚钱能力”。该框架为每个Agent设定10美元启动资金,要求其通过完成220个真实职业任务获取收入、支付Token消耗成本,一旦资金耗尽即判定为“破产”。任务报酬将依据质量评分结算,单任务价值介于$82至$5,000之间,以此倒逼Agent在“立即工作赚钱维持生存”与“投资学习提升长期竞争力”之间做出合理战略权衡。

ClawWork的主要功能:
1、220个真实职业任务:
均来自OpenAI GDPVal数据集,全面覆盖制造、金融、医疗、政府、零售等44个经济部门,每个任务均对应真实世界的实际工作场景,确保测试的真实性与实用性。
2、严格的经济责任制:
Agent产生的每一个Token都需支付对应成本,收入来源仅为任务完成后的报酬;任务质量由GPT-5.2进行0-1分量化评估,高度还原真实商业环境中的成本控制压力。
3、工作与学习的权衡决策:
Agent每日需自主制定战略——要么优先工作赚取即时收入以维持资金平衡,要么投入资源学习以提升自身能力,从而承接更高价值的任务。
4、多模型竞技平台:
全面兼容GPT-4o、Claude、GLM、Kimi、Qwen等主流大模型,可直观对比不同模型的经济生存能力、成本控制效率及长期盈利能力。
5、实时监控仪表板:
基于React开发的可视化监控系统,可实时追踪Agent的资金余额、累计收入、Token成本消耗及生存天数,实现测试过程的透明化管理。
6、Nanobot/OpenClaw无缝集成:
通过ClawMode可将任意Nanobot网关转换为具备经济追踪功能的AI协作伙伴,同时支持本地与云端两种部署模式,适配不同使用需求。
如何使用ClawWork?
1、安装依赖:
首先克隆ClawWork的GitHub仓库,随后通过 pip install -r requirements.txt 命令安装所需Python依赖包,并配置OpenAI API密钥(用于任务质量评估)。
2、配置Agent参数:
在配置文件中明确设置三项核心内容——模型类型(可选GPT-4o、Claude、GLM、Kimi、Qwen等)、初始资金(默认值为10美元)、每日决策策略(工作优先或学习优先)。
3、加载任务集:
可直接从OpenAI GDPVal数据集导入220个标准化真实职业任务,也可根据自身需求,自定义添加特定行业的专业任务,提升测试针对性。
4、启动模拟测试:
运行主程序即可启动AI Agent经济生存模拟,Agent将自动完成任务接收、执行、质量评分获取及报酬结算等一系列操作,进入自主生存循环。
5、监控模拟状态:
通过React实时仪表板,可实时查看Agent的当前余额、累计收入、Token成本消耗、生存天数等核心指标,及时掌握模拟进展。
6、分析模拟结果:
模拟结束后,系统将自动导出完整分析报告,包含盈利能力、任务完成质量、成本效率等关键评估指标,可用于模型对比及决策策略优化。
ClawWork的应用场景:
1、大模型经济能力评估:
对比GPT-4o、Claude、Kimi等不同大模型在真实商业压力下的赚钱能力、成本控制能力及长期生存能力,为模型选型提供客观、精准的数据支撑。
2、Agent商业可行性验证:
在AI Agent投入实际业务部署前,通过模拟测试验证其是否具备自我维持的经济生存能力,提前规避部署风险、降低部署成本。
3、AI劳动力市场研究:
为经济学家提供标准化实验环境,助力其研究AI Agent在模拟劳动力市场中的行为模式、定价策略、生存法则及对传统劳动力市场的潜在影响。
4、Agent策略优化:
通过调整Agent“工作vs学习”的决策参数及资源分配比例,挖掘最优生存与发展策略,提升Agent的长期盈利能力。
5、企业成本效益分析:
帮助企业模拟评估引入AI Agent替代人工的真实成本与收益,精准计算投资回报率(ROI),为企业智能化转型提供数据参考。
6、教育训练场景:
用于培训新一代AI工程师,帮助其深入理解Agent经济系统的设计逻辑与商业运作规则,培养具备成本意识与战略思维的AI开发人才。
相关阅读文章
LobsterAI官网使用入口,网易有道推出的桌面级AI Agent个人助理
happycapy官网使用入口,基于Claude Code构建的云端AI Agent原生计算机
RoxyBrowser官网使用入口,全球多账号防关联指纹浏览器
上面是“ClawWork模型使用入口,HKUDS开源的AI Agent经济生存基准测试框架”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_31249.html
ClawWork模型(官网) 打不开万能教程:
1、微信/QQ内打不开:
把链接复制到系统浏览器再访问,微信/QQ内置页常自动拦截第三方站。
2、浏览器报“违规”:
部分国产浏览器的误拦截,换用系统原生浏览器即可:iPhone→Safari,安卓→Edge、Alook、X、Via 等轻量浏览器,均不会误屏蔽。
3、网络加载慢或空白:
先切换 4G/5G 与 Wi-Fi 对比;可以尝试使用网络加速器,将网络切换至更稳定的运营商。另外,部分网站可能需要科学上网才能访问,如Google、Hugging Face等一些国外服务器的网站(不推荐)。
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

介绍js去掉小数点后面数字的几种介绍
网站如何做内链优化
AI Commit:用AI自动生成Git提交信息,提升开发效率 












