财富直通车
首页
基金资讯
股票资讯
每日快讯
币种百科
首页
币种百科
股票
基金
快讯
首页
每日快讯
正文内容
xuect
2026年01月23日 06:38
4
人工智能代理是否已为工作场所做好准备?一项新的基准测试引发了人们的质疑。
来自训练数据公司Mercor的一项最新基准测试表明,人工智能模型在应对现实世界中的白领工作任务时仍然面临挑战。这项名为Apex-Agents的测试基于咨询、银行和法律等行业的实际工作数据,结果显示,即使是Gemini 3 Flash和GPT-5.2这样的顶级模型,在大多数查询中也表现不佳,准确率低于25%。关键挑战在于多领域信息检索,而这正是人类的核心技能。研究人员注意到人工智能技术正在快速进步,但最终得出结论:人工智能尚未做好取代专业人士的准备。
直通车game推荐阅读
OKX下载
交易所排行
比特币平台下载
微信
QQ
QQ空间
微博
相关文章
分析师预测ETH先跌至1500美元后飙升至3.2万美元
2026-02-09
5
【旧存款地址停用通知】
2026-02-09
5
门罗币、BNB、Sui、AVAX、LINK 在 2026 年残酷崩盘中表现优于主流加密货币
2026-02-09
5
数据:Gate 24小时资金净流入超1781万美元,位列全球第一
2026-02-09
5
Tom Lee 发出市场触底信号:为什么精明的资金正在转向 Quantum Security 和 BMIC?
2026-02-09
5
Maple:Web应用程序存在安全漏洞,用户存款安全
2026-02-09
5