爬蟲python的爬取步驟,python爬取天氣預報并發送短信_Python3爬蟲教程之利用Python實現發送天氣預報郵件...

 2023-11-18 阅读 27 评论 0

摘要:前言此次的目標是爬取指定城市的天氣預報信息,然后再用Python發送郵件到指定的郵箱。下面話不多說了,來一起看看詳細的實現過程吧一、爬取天氣預報爬蟲python的爬取步驟、1、首先是爬取天氣預報的信息,用的網站是中國天氣網,網址是http://www.wea

3a2c5c47719654b2eb3ed26ac95e70d8.png

前言

此次的目標是爬取指定城市的天氣預報信息,然后再用Python發送郵件到指定的郵箱。

下面話不多說了,來一起看看詳細的實現過程吧

一、爬取天氣預報

爬蟲python的爬取步驟、1、首先是爬取天氣預報的信息,用的網站是中國天氣網,網址是http://www.weather.com.cn/static/html/weather.shtml,任意選擇一個城市(比如武漢),然后要爬取的內容為下面的部分:

先查看網頁源代碼,并沒有找到第一張圖中的內容,說明是這些天氣信息是通過別的方式加載出來的。我們打開開發者工具,點擊XHR選項,發現沒有任何內容,但是點擊JS選項后可以找到如下內容:

然后就是把URL復制下來進行爬取,不過要注意加上User-Agent和Referer字段,而且如果一直用一個User-Agent的話就會被識別出來,所以我們需要定義一個函數來返回隨機的User-Agent以供使用。

def get_agent():

import random

python爬蟲有什么用。user_agent_list = [

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"

"Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11",

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6",

"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6",

爬蟲爬取數據,"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1",

"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5",

"Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5",

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",

"Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",

python爬蟲教程、"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",

"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",

"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",

python有什么用,"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",

"Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3",

"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24",

"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"

]

用python爬取網站數據,return random.choice(user_agent_list)

爬取后的結果如下:

{'PM2.5': '158',

'城市': '武漢',

'天氣': '多云',

python爬蟲網站?'日期': '12月16日(星期日)',

'洗車指數': '無雨且風力較小,易保持清潔度。',

'溫度': '12℃',

'相對濕度': '47%',

'穿衣指數': '建議著厚外套加毛衣等服裝。',

python獲取天氣數據、'紫外線指數': '涂擦SPF大于15、PA+防曬護膚品。',

'風力等級': '2級',

'風向': '西南風'}

2、我們已經能爬取天氣預報的內容了,但是如果我們想要爬取任意城市的天氣預報,又要怎么辦呢?

先找幾個城市對應的鏈接看一下:武漢(http://www.weather.com.cn/weather1d/101200101.shtml)、廣州(http://www.weather.com.cn/weather/101280101.shtml?)、杭州(http://www.weather.com.cn/weather1d/101210101.shtml),很明顯每個城市有一個對應的編碼,而我們只要獲得全國主要城市的編碼信息,也就能得到這些城市的天氣預報了。

爬蟲python代碼,這一步花費了我不少時間,問題就在于從哪里得到這些編碼信息,最后找到了一個辦法。首先是查看國內天氣預報,當我們的鼠標移到某個省的地圖上的時候,就會顯示其省會的天氣情況:

而當我們用鼠標左鍵點擊的時候,就能夠查看這個省的整體天氣情況:

打開開發者工具,點擊XHR選項,可以發現有如下內容,而這些數據里就包含著我們需要的編碼信息:

做到這一步我們就可以獲得全國主要城市的編碼信息了,不過要注意的是,這些編碼并不都是能直接添加到我們的代碼中進行使用的,通過觀察可以發現,四個直轄市的編碼是不需要做改變的,其余的省需要在得到的編碼后面加上一個01。

二、發送郵件

python爬蟲爬取網頁所有數據,要使用Python來發送郵件,需要使用兩個模塊:smtplib和email。這兩個模塊是Python自帶的,只需import即可使用,其中smtplib模塊主要負責發送郵件,email模塊主要負責構造郵件。

我使用的是163郵箱,用別的郵箱也可以,不過方法會有所不同。在發送郵件之前,需要先設置授權碼,在設置完之后,要記住你的授權碼,在后面會用到的:

一個測試的例子如下:

import smtplib

from email.header import Header

python爬取天氣數據。from email.mime.text import MIMEText

sender = "xxx@163.com" # 發件人的郵箱

password = "xxx" # 這里的密碼不是登陸郵箱的密碼,而是授權碼

receiver = "xxx@163.com" # 收件人的郵箱,可以是同一個

mail = MIMEText("這是郵件內容", 'plain', 'utf-8') # 郵件內容

python自動發郵件腳本。mail['Subject'] = Header('這是郵件主題', 'utf-8') # 郵件主題

mail['From'] = sender # 發件人

mail['To'] = receiver # 收件人

smtp = smtplib.SMTP()

smtp.connect('smtp.163.com', 25) # 連接郵箱服務器

smtp.login(sender, password) # 登錄郵箱

smtp.sendmail(sender, receiver, mail.as_string()) # 第三個是把郵件內容變成字符串

smtp.quit() # 發送完畢,退出

print('郵件已成功發送!')

有幾點要注意的是:

(1)mail['From']和mail['To']是一定要加上的,不能省略;

(2)由于使用的是163郵箱,所以連接服務器的時候使用的是smtp.163.com;

(3)郵件主題里不要使用“test”,不然會被標記為垃圾郵件。

三、運行結果

首先是程序運行的結果截圖:

然后打開郵箱查看:

完整代碼已上傳到GitHub:https://github.com/QAQ112233/Weather(本地下載)

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對的支持。

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/4/178025.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息