mongodb怎么使用，python爬蟲scrapy連接mongodb_爬蟲框架scrapy和數據庫MongoDB的結合使用（二）實戰

2023-10-15 阅读 28 评论 0

摘要：目標抓取盜墓筆記小說網站上《盜墓筆記》這本書的書名、章節名、章節url，并存放到MongoDB中 1.Scrapy中settings.py的設置（先scrapy startproject novelspider）在settings.py中配置MongoDB的IP地址、端口號、數據記錄名稱，并通過settings.py使pi

目標抓取盜墓筆記小說網站上《盜墓筆記》這本書的書名、章節名、章節url，并存放到MongoDB中

1.Scrapy中settings.py的設置（先scrapy startproject novelspider）

在settings.py中配置MongoDB的IP地址、端口號、數據記錄名稱，并通過settings.py使pipelines.py生效：

4df869b32cab

2.Scrapy中item.py設置

4df869b32cab

3.Scarpy中pipelines.py的設置

mongodb怎么使用？在pipelines中可以像普通的python文件操作MongoDB一樣編寫代碼出來需要保持到MongoDB中的數據，然而不同的是這里的數據來自items，這樣做的好處是將數據抓取和處理分開。

4df869b32cab

在通過settings導入MONGODB字典時竟然報錯了~~~~（瑪德），所示格式錯誤，不明所以，故mongodb的設置直接寫到pipelines中。把spider抓取到的數據存放到item實例中，再通過dict字典化insert到mongodb中。

4.spider文件下新建novspider.py

4df869b32cab

5.運行爬蟲

有兩種方法運行，一種是直接在cmd下輸入 scrapy crawl xxxspider，當然你得先cd到xxxspider文件夾下；

另一種是在xxxspider文件夾下（和scrapy.cfg同一個目錄下）建立一個mian.py腳本，其內容為：

4df869b32cab

scrapy的爬蟲怎調用，6.運行結果

刷新mongodb，我存放到mydb3中：

4df869b32cab

8.源碼

我分享到了百度云盤：鏈接：http://pan.baidu.com/s/1dFjxViD 密碼：a8m7

可能會失效，有需要的M我~~~~ 謝謝大家支持,荊軻刺秦王！

版权声明：本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接：https://hbdhgg.com/2/137943.html

上一篇：pycharm改python版本，python版本切換_如何在cmd下切換不同版本的Python

下一篇：怎么把字符串中的數字提取出來，python3提取字符串中的數字_如何在Python中從字符串中提取數字?

标签：mongodb怎么使用 scrapy的爬蟲怎調用 scrapy可視化爬蟲 mongodb入門 MongoDb 爬蟲框架scrapy python爬蟲教程 python mongodb查詢

mongodb怎么使用

2023-12-25mongodb菜鳥教程，mongodb入門基本語法
2023-11-14mongodb使用，MongoDB安裝和入門
2023-11-09mongoengine，MongoDB工具MagicMongoDBTool使用介紹(一） -- 簡單MongoDB入門
2023-10-20mongodb 命令，MongoDB基本語法和操作入門
2023-10-17golang mongodb，go使用mongodb

最新文章

阅读排行

猜你喜欢

本站为非赢利网站，部分文章来源或改编自互联网及其他公众平台，主要目的在于分享信息，版权归原作者所有，内容仅供读者参考，如有侵权请联系我们删除！

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息

我要关灯
我要开灯
客户电话
工作时间：8:00-18:00
客服电话
电子邮件
admin@qq.com
官方微信
扫码二维码
获取最新动态
返回顶部