python爬虫教程,附带作业截图

名片

墨觉 已认证

联系方式

已经完成,请勿再联系

热度

  • 预计价格:¥1
  • 状态: 已完成

第一部分:在计算机上安装Python的requests库

打开cmd或者在pycharm终端中输入如下命令

  1. pip install requests
一键复制

python爬虫教程,附带作业截图

这样就是已经安装成功

python爬虫教程,附带作业截图

第二部分:爬取网页的源代码并输出

这里以我自己的个人主页网站为爬取对象。网址:

https://www.mojue88.com/

  1. 编写Python脚本
    打开您喜欢的文本编辑器或IDE(如VS Code、PyCharm等),并创建一个新的Python文件(例如fetch_mojue88.py)。

  2. 编写代码以获取网页源代码
    将以下代码粘贴到您的Python文件中:

  1. """
  2. * @Author : Denver 墨觉云屋
  3. * @Url : i.mojue88.com
  4. * @Date : 2024-09-18 10:44:21
  5. * @Email : admin@mojue88.com
  6. * @Project : python爬虫示例 */
  7. """
  8. import requests
  9. url = 'https://www.mojue88.com/'
  10. headers = {
  11. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
  12. }
  13. response = requests.get(url, headers=headers)
  14. if response.status_code == 200:
  15. # 使用text属性获取网页的源代码
  16. html_content = response.text
  17. # 输出网页源代码
  18. print(html_content)
  19. else:
  20. print(f"请求失败,状态码:{response.status_code}")
一键复制

运行脚本
在命令行中导航到您的Python文件所在的目录,并运行该文件:

  1. python fetch_mojue88.py
一键复制

或者如果您的系统要求使用python3:

  1. python3 fetch_mojue88.py
一键复制
  1. 查看输出
    如果一切设置正确,您将看到https://www.mojue88.com/网页的源代码被打印到命令行或您的终端中,包括中文字符。

  2. 输出结果:python爬虫教程,附带作业截图
  3. 代码截图:python爬虫教程,附带作业截图

0 条回复 A文章作者 M管理员
欢迎您,新朋友,感谢参与互动!
😊 表情
  • 贴吧
  • 泡泡
  • 黄脸
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
私信列表
搜索