V2EX 最热主题
01:27 · Dec 16, 2025 · Tue
V2EX-最热主题
这可能是下一个周经帖:国产大模型哪个编程能力最顶?
Telegraph
|
source
(author: kaesi0)
Telegraph
这可能是下一个周经帖:国产大模型哪个编程能力最顶?
kaesi0: 如题,在不考虑价格的情况,目前国产大模型哪个编程能力最顶呢,以及各自的擅长领域,参赛的选手有: GLM-4.6:说是 Claude Sonnet 4.5 和 GPT-5 ,但价格仅需要 Sonnet 1/7 Qwen3-Code:SWE-bench Live 测试中得分 54.7 ,超越 GPT-4.1 ( 48.6 ),中文 API 文档理解准确率达 92% DeepSeek-V3.2-Exp:说是被 GLM4.6 超过,但在 Vercel 、Windsurf 等编程平台接入 MiniMax…
Home
Powered by
BroadcastChannel
&
Sepia