通常我们会选择使用request模块来发 送 HTTP 请求。
因为requests 模块比 urllib 模块更简洁。
但requests模块并不是python内置的标准库,我们需要使用pip命令来安装这个模块!
pip install requests
request的使用相比于urllib简洁了很多,如下所示:
# 导入 requests 包
import requests
# 发送请求
x = requests.get('https://www.w3cschool.cn/')
# 返回网页内容
print(x.text)
每次调用 requests 请求之后,会返回一个 response 对象,该对象包含了具体的响应信息。
响应信息如下:
属性或方法 | 说明 |
---|---|
apparent_encoding | 编码方式 |
close() | 关闭与服务器的连接 |
content | 返回响应的内容,以字节为单位 |
cookies | 返回一个 CookieJar 对象,包含了从服务器发回的 cookie |
elapsed | 返回一个 timedelta 对象,包含了从发送请求到响应到达之间经过的时间量,可以用于测试响应速度。比如 r.elapsed.microseconds 表示响应到达需要多少微秒。 |
encoding | 解码 r.text 的编码方式 |
headers | 返回响应头,字典格式 |
history | 返回包含请求历史的响应对象列表(url) |
is_permanent_redirect | 如果响应是永久重定向的 url,则返回 True,否则返回 False |
is_redirect | 如果响应被重定向,则返回 True,否则返回 False |
iter_content() | 迭代响应 |
iter_lines() | 迭代响应的行 |
json() | 返回结果的 JSON 对象 (结果需要以 JSON 格式编写的,否则会引发错误) |
links | 返回响应的解析头链接 |
next | 返回重定向链中下一个请求的 PreparedRequest 对象 |
ok | 检查 "status_code" 的值,如果小于400,则返回 True,如果不小于 400,则返回 False |
raise_for_status() | 如果发生错误,方法返回一个 HTTPError 对象 |
reason | 响应状态的描述,比如 "Not Found" 或 "OK" |
request | 返回请求此响应的请求对象 |
status_code | 返回 http 的状态码,比如 404 和 200(200 是 OK,404 是 Not Found) |
text | 返回响应的内容,unicode 类型数据 |
url | 返回响应的 URL |
# 导入 requests 包
import requests
# 发送请求
x = requests.get('https://www.w3cschool.cn/')
# 返回 http 的状态码
print(x.status_code)
# 响应状态的描述
print(x.reason)
# 返回编码
print(x.apparent_encoding)
输出结果如下:
200
OK
utf-8
请求 json 数据文件,返回 json 内容:
# 导入 requests 包
import requests
# 发送请求
x = requests.get('https://www.w3cschool.cn/try/ajax/json_demo.json')
# 返回 json 数据
print(x.json())
输出结果如下:
{'name': '网站', 'num': 3, 'sites': [{'name': 'Google', 'info': ['Android', 'Google 搜索', 'Google 翻译']}, {'name': 'w3cschool', 'info': ['编程狮', '编程狮工具', '编程狮微信']}, {'name': 'Taobao', 'info': ['淘宝', '网购']}]}
requests 方法如下表:
方法 | 描述 |
---|---|
delete(url, args) | 发送 DELETE 请求到指定 url |
get(url, params, args) | 发送 GET 请求到指定 url |
head(url, args) | 发送 HEAD 请求到指定 url |
patch(url, data, args) | 发送 PATCH 请求到指定 url |
post(url, data, json, args) | 发送 POST 请求到指定 url |
put(url, data, args) | 发送 PUT 请求到指定 url |
request(method, url, args) | 向指定的 url 发送指定的请求方法 |
使用 requests.request() 发送 get 请求:
# 导入 requests 包
import requests
# 发送请求
x = requests.request('get', 'https://www.w3cschool.cn/')
# 返回网页内容
print(x.status_code)
输出结果如下:
200
设置请求头:
# 导入 requests 包
import requests
kw = {'w':'python 教程'}
# 设置请求头
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
# params 接收一个字典或者字符串的查询参数,字典类型自动转换为url编码,不需要urlencode()
response = requests.get("https://www.w3cschool.cn/search/", params = kw, headers = headers)
# 查看响应状态码
print (response.status_code)
# 查看响应头部字符编码
print (response.encoding)
# 查看完整url地址
print (response.url)
# 查看响应内容,response.text 返回的是Unicode格式的数据
print(response.text)
输出结果如下:
200
UTF-8
https://www.w3cschool.cn/search/?w=python+%E6%95%99%E7%A8%8B
... 其他内容...
post() 方法可以发送 POST 请求到指定 url,一般格式如下:
requests.post(url, data={key: value}, json={key: value}, args)
# 导入 requests 包
import requests
# 发送请求
x = requests.post('https://www.w3cschool.cn/try/ajax/demo_post.php')
# 返回网页内容
print(x.text)
输出结果如下:
<p style='color:red;'>本内容是使用 POST 方法请求的。</p><p style='color:red;'>请求时间:
2022-05-26 17:30:47</p>
post 请求带参数:
# 导入 requests 包
import requests
# 表单参数,参数名为 fname 和 lname
myobj = {'fname': 'w3cschool','lname': 'Boy'}
# 发送请求
x = requests.post('https://www.w3cschool.cn/try/ajax/demo_post2.php', data = myobj)
# 返回网页内容
print(x.text)
输出结果如下:
<p style='color:red;'>你好,w3cschool Boy,今天过得怎么样?</p>