为什么国内的大模型号称领先,为什么在实际的coding过程中使用却很少?
国内模型的主要问题在于 你给他一个小任务 比如写个html 或者实现一个逻辑 他能给你写的很好(KIMI,GLM,qwen我用过这仨都这样) 但涉及到复杂任务尤其是需要架构的任务的时候就开始犯糊涂 容易屎山 层层嵌套调用然后测试的时候报错一堆
肯定还得优化,但绝不是不能用 我现在vibe的话 会把构思/方案给claude,claude细化成结构的promot 拆开来给kimi跑 最终review和测试给codex 效率很好
有钱的可以全程claude 刚上手用组合方案能省不少订阅费,如果用中转站的话一个月vibe开销可能不到50rmb
说白了就是claude/codex是PM/manager,国模是senior senior能不能写代码,肯定能,但需要PM和manager。