本篇简单介绍 xpath 在python爬虫方面的使用,想要具体学习 xpath 可以到 w3school 查看 xpath 文档
Python爬虫教程-21-xpath
什么是 XPath?
- XPath 使用路径表达式在 XML 文档中进行导航
- XPath 包含一个标准函数库
- XPath 是 XSLT 中的主要元素
- XPath 是一个 W3C 标准
- 用途:它是一种用来确定XML文档中某部分位置的语言
- XPath开发工具:
- 开源的XPath表达式工具:XMLQuire
- Chrome 插件:XPath Helper
- FIrefox插件:XPath CHecker
- XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快的被开发者采用来当作小型查询语言
- 在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点
xml案例py24.xml文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py24.xml
<?xml version="1.0" encoding="UTF-8" ?><booksore> <book category="cooking"> <title lang="en">Everyday Italian</title> <auther>Gidada De</auther> <year>2018</year> <price>23</price> </book> <book category="education"> <title lang="en"www.tianjiuyule178.com>Python is Python</title> <auther>Food www.huayiyul.com/ www.thq666.com/ War</auther> <year>2008</year> <price>83</price> </book> <book category="sport"> <title lang=www.yigou521.com/ "en">Running</title> <auther>Klaus www.trgj888.com Kuka<www.yongshiyule178.com /auther> <year>2010</year> <price>43</price> </book></booksore>