python--爬虫01

 2023-09-15 阅读 30 评论 0

摘要:首先要引入urllib包 利用urlopen打开需要采集的网址import urllib.request url = "http://www.baidu.com" htmlobj = urllib.request.urlopen(url) html = htmlobj.read() #二进制的代码 html = html.decode("utf-8") #解码 print(html)#####
首先要引入urllib包
利用urlopen打开需要采集的网址import urllib.request
url = "http://www.baidu.com"
htmlobj = urllib.request.urlopen(url)
html = htmlobj.read()  #二进制的代码
html = html.decode("utf-8")  #解码
print(html)################################################## 获取到的网页代码<html>
<head><meta http-equiv="content-type" content="text/html;charset=utf-8"><meta http-equiv="X-UA-Compatible" content="IE=Edge"><meta content="always" name="referrer"><meta name="theme-color" content="#2932e1"><link rel="shortcut icon" href="/favicon.ico" type="image/x-icon" /><link rel="search" type="application/opensearchdescription+xml" href="/content-search.xml" title="百度搜索" /> <link rel="icon" sizes="any" mask href="//www.baidu.com/img/baidu.svg"><link rel="dns-prefetch" href="//s1.bdstatic.com"/><link rel="dns-prefetch" href="//t1.baidu.com"/><link rel="dns-prefetch" href="//t2.baidu.com"/><link rel="dns-prefetch" href="//t3.baidu.com"/>.................................................

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/2/59442.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息