爬虫常用Xpath和CSS3选择器对比

 2023-09-09 阅读 24 评论 0

摘要:爬虫常用Xpath和CSS3选择器对比 1. 简介   CSS是来配合HTML工作的,和Xpath对比起来,CSS选择器通常都比较短小,但是功能不够强大。CSS中的空白符' '和Xpath的'//'都表示当前元素的所有后代(子孙)元素。 2. 对比   对于

爬虫常用Xpath和CSS3选择器对比

1. 简介

  CSS是来配合HTML工作的,和Xpath对比起来,CSS选择器通常都比较短小,但是功能不够强大。CSS中的空白符' 'Xpath'//'都表示当前元素的所有后代(子孙)元素。

2. 对比

  对于元素(标签)的操作,Xpath和CSS基本上都能通过各自的语法达到相同的动作,并且爬虫中使用的都是一些相对简洁明了的操作。

 结果 CSS3选择器 Xpath表达式
所有元素* //*
所有p元素p //p
所有p元素的子元素(只选一代)p>* //p/*
所有父元素为div的p元素div p//div//p
所有id为foo的元素#foo  //*[@id="foo"]
所有class为foo的元素.foo//*[@class="foo"]
拥有某个属性的元素*[title]//*[@title]
title属性为target的所有元素*[title="target"]//*[@title="target"]
所有p元素的第一个子元素p>*:first-child //p/*[0] 
所有拥有a元素的p元素无法实现//p[a]
p元素的下一个兄弟元素p+*//p/following-sibling::*[0]

 3. 参考资料

  • 紫云飞博文
  • CSS选择器参考手册

 

转载于:https://www.cnblogs.com/strivepy/p/10432619.html

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/5/31921.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息