让任意软件秒变 Agent 原生工具，暴涨 15000+ GitHub Star！

最近这段时间，身边越来越多的朋友开始把日常任务交给 Agent 来做。

写代码、查文档、整理数据等等，但一直有个问题没有得到解决，就是 Agent 不会自动操作工具。

有朋友试过截图加模拟点击，稍微弹个系统弹窗，整个流程直接断掉。

也有人用 Python 库自己实现，但软件本身有诸多限制，出来的效果差距明显。

直到最近，一个叫 CLI-Anything 的开源项目，为我们提供了解决方案，刚开源就暴涨 15000+ GitHub Star。

与其他工具有所不同，它选择了一条不一样的路，使用命令行来连接 Agent 和软件。

CLI 是人类和机器共通的接口，结构化、可组合，天然匹配大模型的输入格式。

CLI-Anything 做的，就是给任意软件自动生成一套这样的命令接口，让 Agent 能直接调用原生软件来执行操作。

简单说，相当于让 AI 把软件的每个功能都翻译成一行可执行的命令，Agent 通过这些命令来驱动软件干活。

整个流程分为 7 个阶段，由 Agent 全程执行。

首先扫描软件源码，把 GUI 操作映射到对应的 API，接着规划命令分组和输出格式。

然后到生成带 REPL、JSON 输出、撤销重做功能的 Click CLI。

最后自动生成测试套件、跑通测试、写文档，最后打包安装到 PATH。

以前要给一款软件手写这套接口，得自己研究 API、设计命令结构、测试、处理各种边界情况，少说要折腾好几天。现在一行命令丢进去，全自动跑完。

另外生成出来的 CLI 提供了两种工作模式。一种是子命令模式，适合脚本和流水线，比如：

cli-anything-gimp project new --width1920--height1080-o poster.json

另一种是 REPL 模式，适合 Agent 交互式操作。启动后进入带状态的会话，Agent 可以连续执行多步操作，不用每次重新建立上下文。

每个命令都内置了 --json 参数。Agent 拿到结构化的 JSON 输出，就能知道上一步执行结果，然后决定下一步怎么走，整个链路串起来。

目前项目里附带了 11 套现成的 CLI，包括 Blender、LibreOffice、OBS Studio 等，已全部测试通过，可以直接装上就能用的生产级接口。

想要上手安装 CLI-Anything 插件，建议使用 Claude Code，执行下面两条命令即可：

/plugin marketplace add HKUDS/CLI-Anything

安装完成，只需要在本地软件目录下执行：

/cli-anything:cli-anything ./gimp

接着，就会触发前面提及到的 7 个阶段全自动跑完，最后生成 CLI。

就可以将 CLI 接入到 OpenCode、OpenClaw、Codex 等 Agent 框架，项目 README 里有提供详细的安装方式。

额外提醒下，建议用 Claude Sonnet 4.6 这些模型，比较稳定一次性输出 CLI。

另外生成过程依赖软件源码，只有编译后二进制的情况下，覆盖率会明显打折。

一次跑下来也不一定能覆盖所有功能，通常还需要执行几次 /refine 来补充细节。

如今大家都在讨论 AI，各大科技巨头都在卷模型有多强，参数有多大。

但模型再强，落不到具体的工具上，也只是在聊天框里打转。

CLI-Anything 想解决的，是 Agent 和真实软件之间那道看不见的墙。

今天的软件是为人设计的，但用它们最多的，说不定很快就会是那些不知疲倦的 Agent。

今天的分享到此结束，感谢大家抽空阅读，我们下期再见，Respect！