Python HTTP标头
客户端和服务器之间的请求和响应涉及消息中的标头和正文。标头包含特定于协议的信息,这些信息出现在通过TCP连接发送的原始消息的开头。消息的正文与标头使用空白行分隔。
标头字段
http响应中的标头可以分为以下类型。以下是标头的说明和示例。
Cache-ControlCache-Control general-header字段用于指定所有缓存系统必须遵守的指令。语法如下:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Cache-Control : cache-request-directive|cache-response-directive
HTTP客户端或服务器可以使用“Cache-Control”常规标头来指定缓存参数或从缓存中请求某些类型的文档。缓存指令在逗号分隔的列表中指定。例如:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Cache-control: no-cache
Connection连接通用标头字段允许发送者指定该特定连接所需的选项,并且代理不能通过其他连接传达这些选项。以下是使用连接头的简单语法:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Connection : "Connection"
HTTP/1.1为发送方定义了“off”连接选项,以指示响应完成后将关闭连接。例如:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Connection: close
默认情况下,HTTP 1.1使用持久连接,该连接在事务处理后不会自动关闭。另一方面,HTTP 1.0默认情况下不具有持久连接。如果1.0客户端希望使用持久连接,则它使用keep-alive参数,如下所示:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Connection: keep-alive
Date所有HTTP日期/时间戳都以格林威治标准时间(GMT)表示。允许HTTP应用程序使用日期/时间戳的以下三种表示形式中的任何一种:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Sun, 06 Nov 1994 08:49:37 GMT ; RFC 822, updated by RFC 1123 Sunday, 06-Nov-94 08:49:37 GMT ; RFC 850, obsoleted by RFC 1036 Sun Nov 6 08:49:37 1994 ; ANSI C's asctime() format
Transfer-Encoding
Transfer-Encoding字段指示已将哪种类型的转换应用于消息正文,以便在发送者和接收者之间安全地进行转换。这与内容编码不同,因为传输编码是消息的属性,而不是实体主体的属性。Transfer-Encoding标头字段的语法如下:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Transfer-Encoding: chunked
所有传输编码值都不区分大小写。
UpgradeUpgrade通用标头允许客户端指定其支持的其他通信协议,并在服务器认为适合切换协议时使用。例如:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
Upgrade标头字段旨在提供一种从HTTP/1.1过渡到其他不兼容协议的简单机制。
Via
网关和代理必须使用Via通用标题来指示中间协议和接收者。例如,可以将请求消息从HTTP/1.0用户代理发送到名为“fred”的内部代理,该代理使用HTTP/1.1将请求转发到位于nowhere.com的公共代理,代理通过以下方式完成请求:将其转发到位于 www.ics.uci.edu 的原始服务器。www.ics.uci.edu 接收到的请求将具有以下Via标头字段:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning
Warning通用标头用于携带有关消息状态或转换的其他信息,这些信息可能未反映在消息中。一个响应可能包含多个警告标头。
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Warning : warn-code SP warn-agent SP warn-text SP warn-date
标头示例
在下面的示例中,使用urllib2模块使用urlopen获得响应。接下来应用info()方法来获取该响应的标头信息。
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25import urllib2 response = urllib2.urlopen('https://www.aizws.net/python/python-index.html') html = response.info() print html
当我们运行上面的程序时,得到以下输出:
# Filename : example.py# Copyright : 2020 By Aizws# Author by : www.aizws.net# Date : 2020-08-25Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9 Accept-Encoding: gzip, deflate, br Accept-Language: zh-CN,zh;q=0.9,en;q=0.8 Cache-Control: max-age=0 Connection: keep-alive Cookie: OUTFOX_SEARCH_USER_ID_NCOO=1091135338.9776888; JSESSIONID=E15B8EC70E5BBF1AEDF4B4EAA2CDB5E8; Hm_lvt_b7b3187b2696243340bf6da4428bc560=1598152290,1598152290,1598152812,1598274529; Hm_lpvt_b7b3187b2696243340bf6da4428bc560=1598326307 Host: www.aizws.net If-Modified-Since: Mon, 24 Aug 2020 12:50:33 GMT If-None-Match: W/"5f43b799-b8ee" Sec-Fetch-Dest: document Sec-Fetch-Mode: navigate Sec-Fetch-Site: none Sec-Fetch-User: ?1 Upgrade-Insecure-Requests: 1 User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36
下一章:Python 自定义HTTP请求
超文本传输协议(HTTP)是用于启用客户端和服务器之间的通信的协议。它用作客户端和服务器之间的请求-响应协议。请求设备称为客户端,发送响应的设备称为服务器。urllib是传统的python库,在python ...