BS4库的使用基础

名片

墨觉 已认证

求:

供:

已完成:

进行中:

联系方式

已经完成,请勿再联系

热度

  • 置顶到期:
  • 帖子有效期:
  • 预计价格:¥2
  • 状态: 进行中 已完成

任务需求:

  1. 安装beautifulsoup4库

  2. 使用requests获得你喜欢的网页的text属性

  3. 使用bs4.BeautifulSoup来把上述网站解析

  4. 使用bs4.BeautifulSoup打印其中的第一个超链接<a>标签节点、标签名、标签内的字符内容

  5. 打印标签<a>的下一个平行节点

  6. (附加题)遍历<a>的所有父节点

废话不多说,直接开干!!!!

(重要)运行代码前,请确保已经安装了requestsbeautifulsoup4库,如果没有安装,可以使用以下命令安装:

pip install requests beautifulsoup4

接下来直接上代码:

""" 
* @Author : Denver 墨觉云屋 
* @Url : i.mojue88.com 
* @Date : 2024-09-29 10:08:21 
* @Email : admin@mojue88.com
 * @Project : python爬虫示例 */
 """
import requests
from bs4 import BeautifulSoup

url = '输入你想获取的网页目标'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

first_a_tag = soup.find('a')
if first_a_tag:
    print("第一个超链接标签节点:", first_a_tag)
    print("标签名:", first_a_tag.name)
    print("标签内的字符内容:", first_a_tag.text)

next_sibling = first_a_tag.find_next_sibling()
print("下一个平行节点:", next_sibling)

遍历<a>的所有父节点
parent = first_a_tag.parent
while parent:
    print("父节点:", parent.name)
    parent = parent.parent

代码截图:

BS4库的使用基础

运行结果1:

BS4库的使用基础

运行结果2:

BS4库的使用基础

 

3 条回复 A文章作者 M管理员
😊 表情
  • 贴吧
  • 泡泡
  • 黄脸
  1. 小可爱

    大佬牛逼 :a42:

  2. 小可爱

    感谢大佬发现 :a0:

  3. 墨觉

    大佬牛逼 :c26:

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索