为什么国内的大模型号称领先，为什么在实际的coding过程中使用却很少？

国内模型的主要问题在于你给他一个小任务比如写个html 或者实现一个逻辑他能给你写的很好（KIMI，GLM，qwen我用过这仨都这样）但涉及到复杂任务尤其是需要架构的任务的时候就开始犯糊涂容易屎山层层嵌套调用然后测试的时候报错一堆

肯定还得优化，但绝不是不能用我现在vibe的话会把构思/方案给claude，claude细化成结构的promot 拆开来给kimi跑最终review和测试给codex 效率很好

有钱的可以全程claude 刚上手用组合方案能省不少订阅费，如果用中转站的话一个月vibe开销可能不到50rmb

说白了就是claude/codex是PM/manager，国模是senior senior能不能写代码，肯定能，但需要PM和manager。