村通网?上个月29日就开售了,12+512是6999
@天天,@晨曦,谢谢!
小尾巴华为Mate50 Pro鸡佬版
有点贵
官网https://aite.xyz/
我是晨曦,我喂自己袋盐!
https://aite.xyz/product/fileadmin.zip
虽然 XSLT 最初被设计为用于 XML 转换的专用语言,但该语言是图灵完备的,这使得它理论上能够进行任意计算。
XSLT 2.0 最重要的创新包括:
使用正则表达式进行字符串操作XSLT 3.0
支持映射和数组,使 XSLT 能够处理 JSON 和 XML。
改进了对动态错误的处理,例如使用 xsl:try 指令。https://en.m.wikipedia.org/wiki/XSLT
@老虎会游泳,好像有点接近,等会儿去看看用法。先谢谢老虎
@无名啊,搜“XSLT html to json”可以看到一些案例。
比如这个:
https://stackoverflow.com/questions/18055368/html-to-json-conversion-in-xslt
用 xpath、css 选择器 来批量提取数据有些吃力
CSS 选择器、xpath 我都用过,对于提取单独几条挺好用的。
但是批量提取整个页面的数据,就麻烦多了。
所以想着有没有验证 HTML 结构的同时,还能提取出内容的。
为啥要验证
页面结构很动态,目前我只能靠验证来确定:
有可能会出现什么元素,不遗漏元素,也不误解元素含义(比如老虎林首页,还有可能出现
[公开]
、[被下沉]
、[评论关闭]
之类的)防止日后结构变化时不自知
@无名啊,这是最接近你想要的东西:
XSLTJSON: Transforming XML to JSON using XSLT
https://github.com/bramstein/xsltjson
XSLT是一种样式表,用于把XML转换为其他表现形式(比如可显示的HTML,甚至是JSON)。该样式表也可以用于验证输入是否与样式匹配。
不过HTML不是严格的XML,不清楚解析器是否能正确处理HTML中的宽松语法。
PHP版:https://symfony.com/doc/current/components/dom_crawler.html
If you prefer CSS selectors over XPath, install The CssSelector Component. It allows you to use jQuery-like selectors:
$crawler = $crawler->filter('body > p');
querySelector的nodejs版本:
https://www.npmjs.com/package/query-selector
@无名啊,验证不了解。最好的html内容提取工具是浏览器的
document.querySelector()
,我在chatgpt机器人里有很多应用。
@老虎会游泳,以前碰到过类似情况吗?有啥好用的工具吗?
@无名啊,如果你想要nosql还需要支持json索引的时候又要支持sql还方便分发,那就只能做取舍了,估计还没人做这样的轮子
@无名啊,unqlite
@缘儿,Python。能提供 C API 就好
@咯叽,啥网页的广告,插件都拦不了?