网站首页 > 技术文章 正文
在Python编程中会遇到向远端服务器发送HTTP请求以获取数据的情况。在Python中可以使用requests库来完成HTTP请求的发送和响应的获取。
相比python内置的urlib2或者urllib3, requests更加简便易用。
request基本用法
requests库在初次使用之前需要安装:
pip install requests
requests库的基本使用方法比较简单直接,例如下面的代码:
import requests
url = "https://www.httpbin.org/get?q=1"
'''
使用requests.get向url的地址发送GET请求。
返回的Response对象r中包含了所有的HTTP响应的所有数据内容。
r.status_code:响应状态码
r.headers: 响应头
r.content_type:数据类型
r.content: 响应的数据内容(字节形式)
r.text: 响应的数据内容(unicode文本)
'''
r = requests.get(url)
print(r.text)
上述代码中,requests.get函数封装了所有的HTTP请求细节,包括:与远端服务器建立(TCP)连接,发送GET请求,接收对方的响应,断开与远端服务器的连接,返回Response对象。
在每次调用get函数的过程中,都会重新建立一次连接。当我们需要多次与同一远端服务通信时,每发送一次请求就建立一次连接,会导致效率低下,非常影响性能。 因此需要重复使用已建立的连接来多次发送请求。
使用Session重复使用连接
HTTP协议中的Keep-Alive提供了长连接保持机制,允许我们使用同一连接多次发送请求。
在requests库中,Kepp-Alive机制在Session对象中实现。我们看下面的例子。
import requests
#服务端url
urls = ("https://www.httpbin.org/get?q=1",
"https://www.httpbin.org/get?p=2",
"https://www.httpbin.org/get?r=3"
)
#创建一个Session对象
s = requests.session()
'''
使用Session对象向服务端发送GET请求。
'''
for url in urls:
r = s.get(url)
print("########################")
print("Response from {}:".format(url))
print("########################")
print(r.text)
在上述代码中使用session()函数创建了一个Session对象,Session对象中的Keep-Alive缺省值是True,这样就会保持一个连接并可重复使用。
在代码中使用创建的Session对象多次向远端服务发送请求。只在第一次发送请求的时候会建立新的连接,后续的请求会使用已经建立的连接,这样可以使得通信的效率有很大的提升。
连接池和线程
此外,还可以使用连接池结合线程向服务器并行发送请求,如下代码所示。
import requests
from threading import Thread
s = requests.Session()
# 使用HTTPAdapter设置连接池的数量,并与session绑定
s.mount('http://', requests.adapters.HTTPAdapter(pool_maxsize=2))
#读取url的线程函数
def thread_get(url):
r = s.get(url)
print("Response from {}:\n\n{}".format(url,r.text))
#服务端url
urls = ("https://www.httpbin.org/get?q=1",
"https://www.httpbin.org/get?p=2",
"https://www.httpbin.org/get?r=3"
)
threads = []
#创建并启动线程
for url in urls:
t = Thread(target=thread_get, args=(url,))
t.start()
threads.append(t)
#等待所有线程结束
for t in threads:
t.join()
运行该代码,可以看到输出结果会与前面单线程的运行结果有所不同。
以上代码均在Python 3.6上运行测试通过。
猜你喜欢
- 2024-10-03 Python访问网络 urllib.request 发送HTTP 请求
- 2024-10-03 python模块之aioHttp 异步请求(在crm中,哪个模块用于跟踪和管理客户服务请求)
- 2024-10-03 推荐几个最佳python应用服务器(一起学习吧)
- 2024-10-03 让 HTTP 服务人类——Python Requests 模块基本用法总结
- 2024-10-03 关于爬虫,HTTP协议了解一下!(关于爬虫,http协议了解一下!正确的有)
- 2024-10-03 干货分享丨Python的HTTP库及示例(http//www.python.org/downloads)
- 2024-10-03 微软太良心了,提供免费服务器可以搭建Python网站
- 2024-10-03 python爬虫必备库——requests(python爬虫需要的库)
- 2024-10-03 如何用Python语言开发大型服务器程序
- 2024-10-03 使用Python获取HTTP请求头数据(在python中用于获取用户输入的函数是)
- 10-02基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- 10-02Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- 10-02AWD-LSTM语言模型是如何实现的_lstm语言模型
- 10-02NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 10-02使用ONNX和Torchscript加快推理速度的测试
- 10-02tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- 10-02Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- 10-02Gateway_gateways
- 最近发表
-
- 基于深度学习的铸件缺陷检测_如何控制和检测铸件缺陷?有缺陷铸件如何处置?
- Linux Mint 22.1 Cinnamon Edition 搭建深度学习环境
- AWD-LSTM语言模型是如何实现的_lstm语言模型
- NVIDIA Jetson Nano 2GB 系列文章(53):TAO模型训练工具简介
- 使用ONNX和Torchscript加快推理速度的测试
- tensorflow GPU环境安装踩坑日记_tensorflow配置gpu环境
- Keye-VL-1.5-8B 快手 Keye-VL— 腾讯云两卡 32GB GPU保姆级部署指南
- Gateway_gateways
- Coze开源本地部署教程_开源canopen
- 扣子开源本地部署教程 丨Coze智能体小白喂饭级指南
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (76)
- js判断是否是json字符串 (75)
- c语言min函数头文件 (77)
- asynccallback (87)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 无效的列索引 (74)