让任意软件秒变 Agent 原生工具,暴涨 15000+ GitHub Star!

最近这段时间,身边越来越多的朋友开始把日常任务交给 Agent 来做。
写代码、查文档、整理数据等等,但一直有个问题没有得到解决,就是 Agent 不会自动操作工具。
有朋友试过截图加模拟点击,稍微弹个系统弹窗,整个流程直接断掉。
也有人用 Python 库自己实现,但软件本身有诸多限制,出来的效果差距明显。
直到最近,一个叫 CLI-Anything 的开源项目,为我们提供了解决方案,刚开源就暴涨 15000+ GitHub Star。

与其他工具有所不同,它选择了一条不一样的路,使用命令行来连接 Agent 和软件。
CLI 是人类和机器共通的接口,结构化、可组合,天然匹配大模型的输入格式。
CLI-Anything 做的,就是给任意软件自动生成一套这样的命令接口,让 Agent 能直接调用原生软件来执行操作。

简单说,相当于让 AI 把软件的每个功能都翻译成一行可执行的命令,Agent 通过这些命令来驱动软件干活。
整个流程分为 7 个阶段,由 Agent 全程执行。
首先扫描软件源码,把 GUI 操作映射到对应的 API,接着规划命令分组和输出格式。
然后到生成带 REPL、JSON 输出、撤销重做功能的 Click CLI。
最后自动生成测试套件、跑通测试、写文档,最后打包安装到 PATH。

以前要给一款软件手写这套接口,得自己研究 API、设计命令结构、测试、处理各种边界情况,少说要折腾好几天。现在一行命令丢进去,全自动跑完。
另外生成出来的 CLI 提供了两种工作模式。一种是子命令模式,适合脚本和流水线,比如:
cli-anything-gimp project new --width1920--height1080-o poster.json
另一种是 REPL 模式,适合 Agent 交互式操作。启动后进入带状态的会话,Agent 可以连续执行多步操作,不用每次重新建立上下文。
每个命令都内置了 --json 参数。Agent 拿到结构化的 JSON 输出,就能知道上一步执行结果,然后决定下一步怎么走,整个链路串起来。
目前项目里附带了 11 套现成的 CLI,包括 Blender、LibreOffice、OBS Studio 等,已全部测试通过,可以直接装上就能用的生产级接口。

想要上手安装 CLI-Anything 插件,建议使用 Claude Code,执行下面两条命令即可:
/plugin marketplace add HKUDS/CLI-Anything
安装完成,只需要在本地软件目录下执行:
/cli-anything:cli-anything ./gimp
接着,就会触发前面提及到的 7 个阶段全自动跑完,最后生成 CLI。
就可以将 CLI 接入到 OpenCode、OpenClaw、Codex 等 Agent 框架,项目 README 里有提供详细的安装方式。
额外提醒下,建议用 Claude Sonnet 4.6 这些模型,比较稳定一次性输出 CLI。
另外生成过程依赖软件源码,只有编译后二进制的情况下,覆盖率会明显打折。
一次跑下来也不一定能覆盖所有功能,通常还需要执行几次 /refine 来补充细节。
如今大家都在讨论 AI,各大科技巨头都在卷模型有多强,参数有多大。
但模型再强,落不到具体的工具上,也只是在聊天框里打转。
CLI-Anything 想解决的,是 Agent 和真实软件之间那道看不见的墙。
今天的软件是为人设计的,但用它们最多的,说不定很快就会是那些不知疲倦的 Agent。
GitHub 项目地址:https://github.com/HKUDS/CLI-Anything
今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!