Python爬虫如何解析HTML页面,下面web建站小编给大家简单介绍一下!
具体语法如下:
import re html = ''' <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>这是页面标题</title> </head> <body> <div class="content"> <h2>这是一级标题</h2> <p>这是一段文本</p> </div> <div class="footer"> <p>版权所有 © 2021</p> </div> </body> </html> ''' pattern = re.compile(r'<div class="content">.*?<h2>(.*?)</h2>.*?<p>(.*?)</p>.*?</div>', re.S) match = re.search(pattern, html) if match: title = match.group(1) text = match.group(2) print(title) print(text)
标签: python爬虫, Python解析HTML
上面是“Python爬虫如何解析HTML页面”的全面内容,想了解更多关于 前端知识 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_4768.html
workflows工作流
- 1个可爱的白色短发女孩
- 一个黑人在森林中穿着折纸的衣服ComfyUI工作流
- 一个迷人而丰满的女巫和一只黑猫骑着飞天扫帚
- 一把令人难忘的美丽吉他ComfyUI工作流
- 一个孤独的身影在未来主义城市
- 一只黑色章鱼ComfyUI工作流
- 一条精致透明的朱红色水晶龙
- 在地铁站里一个迷茫的非主流姑娘
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!