
一、这东西是干嘛的
简单说就是一个 Windows 版的auto.js或者算按键精灵,但脚本语言用的是 JavaScript,而且内置了 AI 帮你写脚本。类似小龙虾那种软件(但是是本地化代码操作,执行起来不会浪费token,哈哈)
因为工作需要,每天从几个政府采购网站采集招标信息。手动复制粘贴一个小时,试过按键精灵,语法太老了,逻辑写起来很痛苦。Auto.js 挺好用,但只能跑安卓。市面上好用的 PC 自动化工具要么收费,要么脚本语言是自研的,出了 Bug 很难排查。
于是自己写了一个,过一阵开发完所有功能就开源。
二、核心功能能力(10模块共87个函数列表)
和按键精灵、Auto.js 对标的能力都有:
截图(全屏、区域)
找图找色(基于 OpenCV 模板匹配,不是简单的像素对比)
模拟键鼠(点击、拖拽、滚轮、组合键)
启动/关闭 Windows 应用
内置浏览器内核,支持 DOM 操作(page.goto()、page.click()、page.fill() 这种,比找图稳定得多)同时也兼容使用控制应用比如用户电脑上的浏览器的方式进行
HTTP 请求(直接调接口)
数据导出 Excel
图片ocr识别
支持gui和cli两种运行方式
支持定时执行
文件类的增改查操作(去掉了删除类的敏感权限动作)
等等
三、最大的不同点
脚本语言是标准 JavaScript(ES6)。可以用 map、filter、try-catch、async/await,写过前端的上手很快。按键精灵是自研语法,这个直接写 JS。
内置 AI 助手。支持 DeepSeek、Claude、GPT,填自己的 API Key 就能用。选中代码或者文件右键可以解释、优化、找 Bug,也可以直接用自然语言描述需求让 AI 生成脚本。
多标签编辑器。对标 VS Code 的快捷键,Ctrl+S 保存、Ctrl+F 查找、Ctrl+/ 注释。支持同时打开多个脚本。
内置浏览器WebView2包,可以多标签打开网页进行操作。
四、跑个例子
写了一个招标信息采集脚本,代码如下:
page.goto("https://bid.gov.cn/search");
page.fill("#keyword", "中标结果公告");
page.click("#search-btn");
page.wait(".result-list", 5000);
var titles = page.allText(".result-item .title");
for (var i = 0; i < titles.length; i++) {
collect({ title: titles[i] });
}
exportExcel(null, "中标信息.xlsx");
log("打印日志");
return "执行完成";
整个过程不需要手动操作,跑完直接拿到 Excel 。以前每天一小时干的活,现在五分钟。
五、一个小提示
目前只支持 Windows(底层用了 Win32 API 和 WebView2),macOS 和 Linux 暂时不支持。
六、后期更新
1、脚本录制-生成可执行的js代码
2、拖曳式编程-让开发更简单,类似扣子那种模式
3、脚本模板库
4、坐标拾取器
5、脚本预检
6、脚本打包EXE-用于分发脚本
有好的想法大家可以提一下,抱拳了