Python爬虫如何解析HTML页面,下面web建站小编给大家简单介绍一下!
具体语法如下:
import re html = ''' <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>这是页面标题</title> </head> <body> <div class="content"> <h2>这是一级标题</h2> <p>这是一段文本</p> </div> <div class="footer"> <p>版权所有 © 2021</p> </div> </body> </html> ''' pattern = re.compile(r'<div class="content">.*?<h2>(.*?)</h2>.*?<p>(.*?)</p>.*?</div>', re.S) match = re.search(pattern, html) if match: title = match.group(1) text = match.group(2) print(title) print(text)
标签: python爬虫, Python解析HTML
上面是“Python爬虫如何解析HTML页面”的全面内容,想了解更多关于 前端知识 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_4768.html
workflows工作流
一套可爱的动漫生物蓬松贴纸图标
一位穿着长袍的强大法师ComfyUI工作流
一只穿着黑色蝴蝶结西装可爱橙色小猫
一群蜜蜂和一个六边形蜂巢ComfyUI工作流
一张严重受损的宇宙飞船的照片ComfyUI工作流
一种长着彩虹翅膀的虫子comfyui工作流
一架受损严重的宇宙飞船内有一只猫
森林里一只空灵的犀鸟ComfyUI工作流
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!