Python爬虫如何解析HTML页面,下面web建站小编给大家简单介绍一下!
具体语法如下:
import re html = ''' <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>这是页面标题</title> </head> <body> <div class="content"> <h2>这是一级标题</h2> <p>这是一段文本</p> </div> <div class="footer"> <p>版权所有 © 2021</p> </div> </body> </html> ''' pattern = re.compile(r'<div class="content">.*?<h2>(.*?)</h2>.*?<p>(.*?)</p>.*?</div>', re.S) match = re.search(pattern, html) if match: title = match.group(1) text = match.group(2) print(title) print(text)
标签: python爬虫, Python解析HTML
上面是“Python爬虫如何解析HTML页面”的全面内容,想了解更多关于 前端知识 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_4768.html
workflows工作流
- 图片转视频ComfyUI工作流
- 一辆机器人虎狮高端混合动力车ComfyUI工作流
- 半透明的玻璃苹果ComfyUI工作流
- 一个精心制作的微型赛车场ComfyUI工作流
- 一个黑人在森林中穿着折纸的衣服ComfyUI工作流
- 奇幻绘画风格:一只巨大蜗牛ComfyUI工作流
- 图生图工作流:粉红色梦幻家园comfyui工作流
- 一朵在晨光中带着露珠的蓝玫瑰
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!