欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
全部教程·
Python语言·
Scrapy爬虫
[目录]
·
Scrapy 定义一个项目
Scrapy 教程
Scrapy 创建项目
Scrapy 官方示例
Scrapy 命令行工具
Scrapy 调试终端
Scrapy 提取数据
Response 和 Selector
Scrapy Spider
Scrapy Spider 分类
Scrapy 概述
Scrapy 环境
Scrapy 蜘蛛
Scrapy 选择器
Scrapy 项目
Scrapy Item Loaders
Scrapy shell
Scrapy Item Pipeline
Scrapy Feed exports
Scrapy 请求和响应
Scrapy 链接提取器
Scrapy 设置
Scrapy 异常
Scrapy 创建一个项目
Scrapy 定义一个项目
Scrapy 第一个蜘蛛
Scrapy 爬取
Scrapy 提取项目
Scrapy 使用Item
Scrapy 跟踪链接
Scrapy 保存数据
Scrapy 记录
Scrapy 统计收集
Scrapy 发送电子邮件
Scrapy Telnet控制台
Scrapy Web服务
Scrapy 教程
Scrapy 创建项目
Scrapy 官方示例
Scrapy 命令行工具
Scrapy 调试终端
Scrapy 提取数据
Response 和 Selector
Scrapy Spider
Scrapy Spider 分类
Scrapy 概述
Scrapy 环境
Scrapy 蜘蛛
Scrapy 选择器
Scrapy 项目
Scrapy Item Loaders
Scrapy shell
Scrapy Item Pipeline
Scrapy Feed exports
Scrapy 请求和响应
Scrapy 链接提取器
Scrapy 设置
Scrapy 异常
Scrapy 创建一个项目
Scrapy 定义一个项目
Scrapy 第一个蜘蛛
Scrapy 爬取
Scrapy 提取项目
Scrapy 使用Item
Scrapy 跟踪链接
Scrapy 保存数据
Scrapy 记录
Scrapy 统计收集
Scrapy 发送电子邮件
Scrapy Telnet控制台
Scrapy Web服务
Scrapy 定义一个项目
项目是用于收集从网站报废的数据的容器。你必须通过定义你的物品来启动你的蜘蛛。要定义项目,请编辑在 first_scrapy (自定义目录)目录下找到的 items.py 文件。该 items.py 看起来如下:
import scrapy
class First_scrapyItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
该 MyItem 类从继承 项目 包含了许多Scrapy已建成为我们预先定义的对象。例如,如果要从网站中提取名称,网址和说明,则需要为这三个属性中的每一个定义字段。
因此,我们添加我们想要收集的项目:
from scrapy.item import Item, Field class First_scrapyItem(scrapy.Item): name = scrapy.Field() url = scrapy.Field() desc = scrapy.Field()
下一章:Scrapy 第一个蜘蛛
Scrapy第一蜘蛛:Spider是一个定义初始URL的类,用于提取数据,如何遵循分页链接以及如何提取和解析 items.py中 定义的字段。Scrapy提供了不同类型的蜘蛛,每种蜘蛛都有特定的用途。在first_scrapy / spid ...
AI 中文社