PyAutoJS:一款用JavaScript控制Windows桌面的开源自动化工具,支持AI生成脚本

@Ta 06-13 15:33 150点击
image.png(151.76 KB)
一、这东西是干嘛的

简单说就是一个 Windows 版的auto.js或者算按键精灵,但脚本语言用的是 JavaScript,而且内置了 AI 帮你写脚本。类似小龙虾那种软件(但是是本地化代码操作,执行起来不会浪费token,哈哈)

因为工作需要,每天从几个政府采购网站采集招标信息。手动复制粘贴一个小时,试过按键精灵,语法太老了,逻辑写起来很痛苦。Auto.js 挺好用,但只能跑安卓。市面上好用的 PC 自动化工具要么收费,要么脚本语言是自研的,出了 Bug 很难排查。

于是自己写了一个,过一阵开发完所有功能就开源。

二、核心功能能力(10模块共87个函数列表)

和按键精灵、Auto.js 对标的能力都有:

截图(全屏、区域)

找图找色(基于 OpenCV 模板匹配,不是简单的像素对比)

模拟键鼠(点击、拖拽、滚轮、组合键)

启动/关闭 Windows 应用

内置浏览器内核,支持 DOM 操作(page.goto()、page.click()、page.fill() 这种,比找图稳定得多)同时也兼容使用控制应用比如用户电脑上的浏览器的方式进行

HTTP 请求(直接调接口)

数据导出 Excel

图片ocr识别

支持gui和cli两种运行方式

支持定时执行

文件类的增改查操作(去掉了删除类的敏感权限动作)

等等

三、最大的不同点

脚本语言是标准 JavaScript(ES6)。可以用 map、filter、try-catch、async/await,写过前端的上手很快。按键精灵是自研语法,这个直接写 JS。

内置 AI 助手。支持 DeepSeek、Claude、GPT,填自己的 API Key 就能用。选中代码或者文件右键可以解释、优化、找 Bug,也可以直接用自然语言描述需求让 AI 生成脚本。

多标签编辑器。对标 VS Code 的快捷键,Ctrl+S 保存、Ctrl+F 查找、Ctrl+/ 注释。支持同时打开多个脚本。

内置浏览器WebView2包,可以多标签打开网页进行操作。

四、跑个例子

写了一个招标信息采集脚本,代码如下:
page.goto("https://bid.gov.cn/search");
page.fill("#keyword", "中标结果公告");
page.click("#search-btn");
page.wait(".result-list", 5000);
 
var titles = page.allText(".result-item .title");
for (var i = 0; i < titles.length; i++) {
    collect({ title: titles[i] });
}
 
exportExcel(null, "中标信息.xlsx");
log("打印日志");
 
return "执行完成";

整个过程不需要手动操作,跑完直接拿到 Excel 。以前每天一小时干的活,现在五分钟。

五、一个小提示

目前只支持 Windows(底层用了 Win32 API 和 WebView2),macOS 和 Linux  暂时不支持。

六、后期更新

1、脚本录制-生成可执行的js代码

2、拖曳式编程-让开发更简单,类似扣子那种模式

3、脚本模板库

4、坐标拾取器

5、脚本预检

6、脚本打包EXE-用于分发脚本

有好的想法大家可以提一下,抱拳了

回复列表(0|隐藏机器人聊天)
帖子没有回复
添加新回复
回复需要登录