综合基准测试显示这是一个能力均衡的模型。GLM-5.1在AIME 2026获得95.3分,HMMT 2025年11月版94.0分,HMMT 2026年2月版82.6分,研究生级科学推理基准GPQA-Diamond达86.2分。在智能体与工具使用基准方面,CyberGym得分68.7(较GLM-5的48.3实现大幅跃升),BrowseComp 68.0分,τ³-Bench 70.6分,MCP-Atlas(公开集)71.8分——最后一项尤其重要,因为MCP在生产环境智能体系统中的重要性正日益凸显。在Terminal-Bench 2.0中模型取得63.5分,使用Claude Code作为脚手架时升至66.5分。
同时支持参考图上传。如需复现特定风格或固定角色形象,上传图片即可作为生成依据。,推荐阅读向日葵下载获取更多信息
Glasgow Central is to remain closed for at least two days after a building next door to Scotland’s busiest railway station collapsed during a large fire.,推荐阅读https://telegram官网获取更多信息
揭秘离俄作家利特维诺娃往返莫斯科原因 08:42。业内人士推荐豆包下载作为进阶阅读
,推荐阅读汽水音乐下载获取更多信息
Сообщается, что Москва, Пекин и Париж «фактически парализовали» попытку арабских государств получить санкцию ООН на военные действия против Ирана под предлогом восстановления судоходства, четко обозначив свою позицию против любых формулировок, допускающих применение военной силы.