全部教程· Python语言· Scrapy爬虫 · Scrapy 定义一个项目

返回

Scrapy 定义一个项目

项目是用于收集从网站报废的数据的容器。你必须通过定义你的物品来启动你的蜘蛛。要定义项目，请编辑在 first_scrapy （自定义目录）目录下找到的 items.py 文件。该 items.py 看起来如下：

import scrapy  

class First_scrapyItem(scrapy.Item):
   # define the fields for your item here like:
      # name = scrapy.Field()

该 MyItem 类从继承项目包含了许多Scrapy已建成为我们预先定义的对象。例如，如果要从网站中提取名称，网址和说明，则需要为这三个属性中的每一个定义字段。

因此，我们添加我们想要收集的项目：

from scrapy.item import Item, Field  

class First_scrapyItem(scrapy.Item):
   name = scrapy.Field()
   url = scrapy.Field()
   desc = scrapy.Field()

下一章：Scrapy 第一个蜘蛛

Scrapy第一蜘蛛：Spider是一个定义初始URL的类，用于提取数据，如何遵循分页链接以及如何提取和解析 items.py中定义的字段。Scrapy提供了不同类型的蜘蛛，每种蜘蛛都有特定的用途。在first_scrapy / spid ...

上一章：Scrapy 创建一个项目

下一章：Scrapy 第一个蜘蛛

小贴士

全部【编程教程】内容源自网络，仅供学习用途，若有遗漏或版权任何问题，请及时【联系我们】，按下 Ctrl+D 或 ⌘+D 收藏本站。

他人最近浏览

用户 24分前浏览了 [Python3教程] 的 [Python3 SMTP发送邮件]
用户 54分前浏览了 [美团技术架构] 的 [移动开发：美团外卖Android Lint代码检查实践]
用户 1小时前浏览了 [JDK下载] 的 [JDK8 下载]
用户 2小时前浏览了 [美团技术架构] 的 [即时配送的订单分配策略：从建模和优化]
用户 2小时前浏览了 [Python3教程] 的 [Python3 运算符]
用户 2小时前浏览了 [编程面试题集锦] 的 [Java高级工程师原理面试题分析]
用户 3小时前浏览了 [编程面试题集锦] 的 [Java易错点区分的面试题合集]
用户 4小时前浏览了 [美团技术架构] 的 [大众点评App的短视频耗电量优化实战]
用户 4小时前浏览了 [编程面试题集锦] 的 [Java面试题的基础知识点]
用户 4小时前浏览了 [编程面试题集锦] 的 [Java基础面试题]

推荐 AI 小工具

^[新]Hi简历

灵动Ai助手

悟智写作

JAX

相芯科技

华盛顿大学

跃迁引擎

Free Logo Maker

GitMind思乎

Chaos® Vantage高阶应用

问小智AIGC助手

站酷梦笔

关于我们/ 免责声明/ 问与答/ 积分奖励消耗规则/ 联系我们/ Markdown 教程 / 今日访问834人，当前在线58人，最高同时在线55人

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。为了更好的体验，本站推荐使用 Chrome 浏览器。