任务需求:
安装beautifulsoup4库
使用requests获得你喜欢的网页的text属性
使用bs4.BeautifulSoup来把上述网站解析
使用bs4.BeautifulSoup打印其中的第一个超链接<a>标签节点、标签名、标签内的字符内容
打印标签<a>的下一个平行节点
(附加题)遍历<a>的所有父节点
废话不多说,直接开干!!!!
(重要)运行代码前,请确保已经安装了requests
和beautifulsoup4
库,如果没有安装,可以使用以下命令安装:
pip install requests beautifulsoup4
接下来直接上代码:
"""
* @Author : Denver 墨觉云屋
* @Url : i.mojue88.com
* @Date : 2024-09-29 10:08:21
* @Email : admin@mojue88.com
* @Project : python爬虫示例 */
"""
import requests
from bs4 import BeautifulSoup
url = '输入你想获取的网页目标'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
first_a_tag = soup.find('a')
if first_a_tag:
print("第一个超链接标签节点:", first_a_tag)
print("标签名:", first_a_tag.name)
print("标签内的字符内容:", first_a_tag.text)
next_sibling = first_a_tag.find_next_sibling()
print("下一个平行节点:", next_sibling)
遍历<a>的所有父节点
parent = first_a_tag.parent
while parent:
print("父节点:", parent.name)
parent = parent.parent
代码截图:
运行结果1:
运行结果2:
大佬牛逼
感谢大佬发现
大佬牛逼