Python爬虫如何解析HTML页面,下面web建站小编给大家简单介绍一下!
具体语法如下:
import re
html = '''
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>这是页面标题</title>
</head>
<body>
<div class="content">
<h2>这是一级标题</h2>
<p>这是一段文本</p>
</div>
<div class="footer">
<p>版权所有 © 2021</p>
</div>
</body>
</html>
'''
pattern = re.compile(r'<div class="content">.*?<h2>(.*?)</h2>.*?<p>(.*?)</p>.*?</div>', re.S)
match = re.search(pattern, html)
if match:
title = match.group(1)
text = match.group(2)
print(title)
print(text)
上面是“Python爬虫如何解析HTML页面”的全面内容,想了解更多关于 前端知识 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_4768.html
workflows工作流
一只穿着黑色蝴蝶结西装可爱橙色小猫
令人着迷的一只老虎ComfyUI工作流
一匹热血沸腾的汗血宝马庄严地站立着ComfyUI工作流
一个女孩骑着一辆生锈的现代摩托车
一只张大嘴巴露出锋利的牙齿正在咆哮的雪豹
一个红头发明亮眼睛的漂亮女人
图生图局部重绘ComfyUI工作流
一只迷人的黑豹ComfyUI工作流
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

利用css绘画棋盘布局(象棋)
用canvas实现画板涂鸦效果
js实现下雪特效
一个包含老黄历、佛历、道历、星宿等数据的日历网站
barcode条形码/qrcode二维码兼容所有浏览器(含ie6/ie7/ie8)
jquery做一个漂亮挂墙动态时钟
css3结合svg做一个动态广告
纯css翻书效果







