数据获取与预处理
创始人
2024-01-20 08:53:36
0

文章目录

  • Requests简介
  • Requests库安装
  • Requests库的基本操作
    • Requests库的7个主要方法
    • Request方法
    • get方法
    • Response对象的属性
    • head方法
    • post方法


Requests简介

提示:这里可以添加本文要记录的大概内容:

首先他是个第三方库,应用非常广泛
采用Apache2Licensed开源的HTTP协议
在urllib库基础上使用Python编写的爬虫库


提示:以下是本篇文章正文内容,下面案例可供参考

Requests库安装

在这里插入图片描述
在这里插入图片描述

Requests库的基本操作

【例】测试网站:哭笑不得语音情感组——情感标注页面
http://emotion.bxbw-jyz.cn/Home/index/showPartData.html
在这里插入图片描述
在这里插入图片描述

代码如下(示例):

import requests
r = requests.get("http://emotion.bxbw-jyz.cn/Home/index/showPartData.html")
demo = r.text
print(demo)

这行代码把页面所有代码全部输出了
在这里插入图片描述
百度谷歌尽量不要爬虫

Requests库的7个主要方法

方法说明HTTP协议
requests.request()构造一个请求HTTP
requests.get()获取HTML网页的主要方法GET
requests.head()获取HTML网页头的信息方法HEAD
requests.post()向HTML网页提交POST请求方法POST
requests.put()向HTML网页提交PUT请求的方法PUT
requests.patch()向HTML网页提交局部修改请求PATCH
requests.delete()向HTML页面提交删除请求DELETE

【例】http://www.baidu.com/s?wd=keyword

import requests
kv={'wd':'Python'}
r = requests.get("http://www.baidu.com/s",params=kv)
demo=r.text
print(r.request.url)
print(len(demo))

在这里插入图片描述
【例】http://emotion.bxbw-jyz.cn/Home/index/showPartData.html

import requests
r=requests.get("http://emotion.bxbw-jyz.cn/Home/index/showPartData.html")
print(r.status_code)
print(type(r))

在这里插入图片描述

Request方法

requests.request(method,url,**kwargs)
参数说明:
method:请求方式
url:页面url链接
**kwargs:控制访问参数,共13个

(1)params:字典或字节序列,作为参数增加到url中
requests.request(method,url,**kwargs)
**kwargs:控制访问参数,共13个

(2) data:字典:
字节序列或文件对象,Request内容

get方法

r=requests.get(url)
url:页面url链接
从服务器获取请求资源
生成Response对象(服务器返回的资源)

requests.get(url, params,**kwargs)
参数说明:
url:页面url链接
params:字典或字节序列
**kwargs:控制访问参数,共12个

Response对象的属性

属性说明
r.status_code返回状态码
r.text响应内容的字符串形式
r.encoding网页的编码方式
r.apparent_encoding分析得到的编码方式
r.content响应内容的二进制方式

head方法

requests.head (url,**kwargs)
参数说明:
URL:页面URL链接
**kwargs:控制访问参数,共12个

【例】http://emotion.bxbw-jyz.cn/Home/index/showPartData.html
【# 井号后的注释与运行截图后红圈对应的东西一致】

import requests
r=requests.head("http://emotion.bxbw-jyz.cn/Home/index/showPartData.html")
print(r.headers)  # r.headers(代表着那几行数据)
print(r.text)

在这里插入图片描述

【同上一例】

import requests
r=requests.head("http://emotion.bxbw-jyz.cn/Home/index/showPartData.html")
print(r.headers)  
print(r.text)   # r.text(代表空行)

在这里插入图片描述

post方法

requests.post(URL,data,json,**kwargs

参数说明:
URL:页面URL链接
data:字典或字节序列
json:JSON格式的数据
**kwargs:控制访问参数,共11个

【例】

import requests
base_url="http://httpbin.org"
form_data={"user":"python39","pwd":'2022'}
#将参数存在字典里
r=requests.post(base_url+'/post',data=form_data)
print(r.url) #打印URL
print(r.status_code)
print(r.json())
print(r.text)  #此处代码对应红框以外的数据

在这里插入图片描述

【例】http://emotion.bxbw-jyz.cn/Home/Index/CheckLogion.html

import requests
datas={'login_name':'jn','login_psd':'123456',}
r=requests.post("http://emotion.bxbw-jyz.cn/Home/Index/CheckLogion.html",data=datas)
demo=r.text
print(demo)

在这里插入图片描述


相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
一帆风顺二龙腾飞三阳开泰祝福语... 本篇文章极速百科给大家谈谈一帆风顺二龙腾飞三阳开泰祝福语,以及一帆风顺二龙腾飞三阳开泰祝福语结婚对应...
美团联名卡审核成功待激活(美团... 今天百科达人给各位分享美团联名卡审核成功待激活的知识,其中也会对美团联名卡审核未通过进行解释,如果能...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...