


bsp;追赶期的标志是,国产模型在关键基准上与全球顶尖水平的差距从“代际差”缩小到“个位数差”——这一步,GLM-5.1在编程方向上已经走到了。 攻坚期的难题是,技术领先能否转化成商业壁垒、开源信任能否转化成定价能力、巨额研发投入何时能在利润表上留下正向的印记。这三个问题,智谱没有回答,整个国产大模型
9.8)。知乎开发者“晴天”用阅读理解、SVG代码生成等场景做横向测试,结论是GLM-5.1连基本阅读理解都未达标;另一位通过Ollama本地部署的开发者评价“整体不如Qwen3.6-Plus”。这些个体测试不代表全貌,但共同指向一个事实:GLM-5.1是一个在编程和Agent方向刻意训练、其他领域有所牺牲的“偏科生”。 &
当前文章:http://3ks.cenqiaota.cn/b0rtg/obi.htm
发布时间:11:33:12