很早之前就想研究研究,一直没有合适的时间,今天刚好没啥事,乘机瞧一瞧xpath的“庐山真面目”。
Xpath简介 XPath全称XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快地被开发者采用来当作小型查询语言。
相关文档
函数手册:https://www.w3school.com.cn/xpath/xpath_functions.asp
参考文档:https://www.w3school.com.cn/xpath/index.asp
Xpath术语 1.节点 在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。
<?xml version=“1.0” encoding=“ISO-8859-1”?> <!–文档节点(根节点)bookstore–> <bookstore>
<book>
<!--普通元素节点title-->
<!--属性节点lang=en-->
<!--内容文本Harry Potter-->
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>
</bookstore>
2.节点关系 在 XPath 中,节点关系可分为:父节点、祖先节点、同胞节点、子节点、后代节点;
Xpath语法 1.基本语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。以下方代码为例:
<?xml version=“1.0” encoding=“ISO-8859-1”?> <bookstore> <book> <title lang=“eng”>Harry Potter</title> <price>29.99</price> </book> <book> <title lang=“eng”>Learning XML</title> <price>39.95</price> </book> </bookstore>
/ 从当前选择的元素内选择子节点 // 从当前选择的元素内选择后代节点 . 选取当前节点。 .. 选取当前节点的父节点。 @ 选取属性。
选择body
./html/body //body /html/body
选择所有名为id的属性
//@id
选择自身名id的属性
/@id 2.谓语
选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[1]
选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()]
选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[last()-1]
选取最前面的两个属于 bookstore 元素的子元素的 book 元素。
/bookstore/book[position()<3]
选取所有拥有名为 lang 的属性的 title 元素。
//title[@lang]
选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。
//title[@lang=‘eng’]
选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]
选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]/title
3.通配符
- # 匹配任何元素节点。 @* # 匹配任何属性节点。 node() # 匹配任何类型的节点。 /book | /css | /newBook 选取若干节点 4.XPath 轴 ancestor #选取当前节点的所有先辈(父、祖父等)。 ancestor-or-self #选取当前节点的所有先辈(父、祖父等)以及当前节点本身。 attribute #选取当前节点的所有属性。 child #选取当前节点的所有子元素。 descendant #选取当前节点的所有后代元素(子、孙等)。 descendant-or-self #选取当前节点的所有后代元素(子、孙等)以及当前节点本身。 following #选取文档中当前节点的结束标签之后的所有节点。 namespace #选取当前节点的所有命名空间节点。 parent #选取当前节点的父节点。 preceding #选取文档中当前节点的开始标签之前的所有节点。 preceding-sibling #选取当前节点之前的所有同级节点。 self #选取当前节点。 使用方法如下:
轴名称::节点测试[谓语]
选取元素的所有属性
//[@id=“fixed”]/aside/attribute:: //[@id=“fixed”]/aside/@ 5.xpath运算符 6.xpath函数 //选择不包含class属性的节点 var result = node.SelectNodes(“.//span[not(@class)]”); //选择不包含class和id属性的节点 var result = node.SelectNodes(“.//span[not(@class) and not(@id)]”); //选择不包含class=“expire”的span var result = node.SelectNodes(“.//span[not(contains(@class,‘expire’))]”); //选择包含class=“expire”的span var result = node.SelectNodes(“.//span[contains(@class,‘expire’)]”);
函数大全
JS使用xpath
- 基本用法
相关文档:
var xpathResult = document.evaluate( xpathExpression, contextNode, namespaceResolver, resultType, result ); //实际例子 document.evaluate(“.//h2”, document.body, null, XPathResult.ANY_TYPE, null); 2.XPathResult对象 iterateNext()snapshotItem(itemNumber) singleNodeValue PHP中使用Xpath <?php
$xml = simplexml_load_file("test.xml");
$result = $xml->xpath("from");
print_r($result);
?>