需要的内容1
需要的内容2
需要的内容3
本文共 908 字,大约阅读时间需要 3 分钟。
from lxml import etree
##################### 基本用法:
#####################
html = ''''''# 生成DOMdom = etree.HTML(html)# 取内容 /text()contents = dom.xpath('//h1[@class="header"]/text()')print(contents)# 取属性 /@attribattribs = dom.xpath('//form/label[@for="username"]/@for')print(attribs) ##################### 复杂用法:登录
#####################
html2 = '''==> 有相同字符开头的属性的标签:需要的内容1
需要的内容2
需要的内容3
==> 签嵌套标签:''' dom = etree.HTML(html2) # 取有相同字符开头的属性的标签的内容 starts-with(@attrib, "abcd") contents2 = dom.xpath('//p[starts-with(@id, "test")]/text()') print(contents2) # 取标签嵌套标签的所有内容 xpath('string(.)') contents3 = dom.xpath('//div[@class="question"]/p')[0].xpath('string(.)') contents3 = contents3.replace('\n', '').replace(' ', '') print(contents3)美女, 你的微信号是多少?
转载地址:http://oakia.baihongyu.com/