java-ee 【Java EE】-使用Fiddler抓包以及HTTP的报文格式

作者：学Java的冬瓜博客主页：☀冬瓜的主页 专栏：【JavaEE】分享: 在满园弥漫的沉静的光芒之前，一个人更容易看到时间，并看到自己的身影。——史铁生《我与地坛》主要内容：使用FIddler抓包的方法，使用FIddler抓包需要知道的注意事项。HTTP协议报文格式:首行，header，空白行，body。HTTP协议中可以自定义的属性。HTTP中get和post请求的区别。HTTP中的header的部分属性分析。HTTP响应状态码

文章目录

一、使用Fiddler抓包二、HTTP协议报文格式1、Fiddler抓到的get和post方法的包2、HTTP报文格式中的详细信息2.1、`首行:`2.2、`header:`2.3、`空白行:`2.4、`body:`

3、http协议中可以自定义的属性

三、HTTP请求方法1、get和post请求的区别(重点)2、其它方法

四、HTTP响应状态码

HTTP协议是应用层最广泛使用的协议之一，HTTP协议为浏览器BS(客户端CS)和服务器的交互制定了规范。

一、使用Fiddler抓包

理解:

HTTP协议的详细交互过程，可以借助第三方工具来看到，我们这里使用Fiddler，抓取HTTP的交互。（wireshark可以抓包传输层TCP/UDP，网络层IP，数据链路层mac等）

理解1：Fiddler本质上是一个代理程序，在客户端(浏览器)发出请求时，请求会先经过代理服务器，然后再到目标服务器，再返回响应给代理服务器，由代理服务器将响应返回给客户端。在请求和响应经过代理服务器时，代理服务器将请求和响应记录下来，再提供可视化界面。理解2：代理服务器可以分为正向代理(客户端的代理)，反向代理(服务器的代理)。上述例子就是正向代理，反向代理比如CDN服务器，企业将一些资源放在运营商的CDN服务器上，便于降低自己服务器压力，且提高客户访问效率。

使用Fiddler抓包注意事项： 1> Fiddler可能会与其它代理程序冲突，使用时要关闭其它代理程序，包括一些浏览器插件。 2> 需要开启HTTPS功能 3> 可能需要手动下载证书，并让导入到浏览器中

第二个注意事项：下载安装后是这样的：然后点：tools->options->https，然后把可以勾选的全部勾上。就开启了HTTPS功能。

第三个注意事项：如果浏览器中不导入证书，那么打开Fiddler访问网站时，可能无法访问(我就遇到了)！所以可能需要手动添加证书到浏览器。具体操作：1> 选择信任该证书tools->options->https->actions->Trust Root ->Certificate->yes。2> 然后把证书放在桌面 actions->Export Root Certificate to Desktop 3> 在谷歌浏览器导入Fiddler证书：点击谷歌浏览器右上角三个点->设置->隐私和安全->安全->滑到下面点击管理HTTPS/SSL证书->导入->下一页->浏览(把刚才保存在桌面的证书导入浏览器)->导入 4> Fiddler和浏览器都重新启动！

使用Fiddler:

1> 要抓包时，可以先点上面的工具栏 X->Remove all，清空原来抓到的包 2> 发送http请求，抓到包后找到我发送的包，双击就可以查看了。在右边的请求响应中，可以使用多种方式显示查看内容。 3> 发送完http请求后，返回Fiddler，选择file->Capture Traffic(或者F12)，就可以暂时停止抓包，便于观察。

二、HTTP协议报文格式

1、Fiddler抓到的get和post方法的包

get请求：

post请求和响应：

从上面的图示中我们可以发现，http的请求报文格式可以分成4个部分：首行、请求头(header)、空白行、请求体(body)。如果是get请求，则请求报文格式中没有body，因为get请求传输的信息放在了首行中；而post请求有body，传输信息放在body中。为什么这么说呢？请往下看。

2、HTTP报文格式中的详细信息

2.1、首行:

1> 请求行：请求报文中的首行

get方法:

post方法：

其实get和post没有本质上的区别，但是携带数据的方式不同。在上图中我们可以看到，get请求的传输数据放在地址栏上，以键=值&键=值的方式传输；而post在地址栏上没有数据传输，传输数据放在body中发送。从上图我们可以知道，一个请求的首行可以分为 http方法 URL 协议版本。下面我们来谈谈URL。一个get请求的URL可以分为协议名称域名/ip 端口路径 ?查询字符串，其中查询字符串以键=值&键=值的方式组织 URL中的一些内容，是可以省略的！端口不写时，是服务器随机分配一个端口给客户端；路径可以是斜杠，比如http://www.baidu.com/，/代表http服务器的根目录；一个post请求则没有查询字符串，因为post一般不用于查询，而是提交数据。

2> 响应行：响应报文中的首行。响应行中get和post请求一样，都是协议版本状态码状态描述，并且响应的状态描述可以省略，因为状态码其实已经描述了这次请求是否成功。

2.2、header:

header：包括请求头，响应头。这里我们主要说请求头，header中描述了http发送时的各种属性。我们主要我们来了解几个比较常用的，请往下看：

1> 请求头：请求部分的header

Fiddler抓到的qq登录的post的请求包的header：

Host：描述了这次请求的服务器所在的ip和端口，这个内容大概率是和URL中的内容一样，但也有一定概率不同，比如如果使用正向代理服务器，那么地址栏上的ip和端口是代理服务器的，但是Host这里的ip和端口则是你最终要访问的服务器的，而非代理服务器的ip和端口。Content-Length：描述了这次请求 body 中的数据长度Content-Type：描述了这次请求 body 中的数据格式User-Agent：描述了客户端的浏览器版本和操作系统的版本，用来区分是 pc端还是移动端。Referer：描述了当前页面的来源URL，如果直接通过地址栏输入地址，或者直接点击收藏夹，都是没有Referer的。我们用这个Referer的属性，来描述一个应用场景：广告主需要浏览者从其他网站跳到自己的网站，从而达到打广告的目的。给其它网站(广告平台)发广告点击费时，需要按照网站的来源给相应的广告平台发钱，所以referer记录了其他网站(就是自己网站的来源)，根据记录的这些其它网站就可以对应到相应的广告平台(浏览器)点击数量，从而正确的发钱。但http有一个问题，就是运营商劫持，运营商的路由器/交换机(可以完成五层转发的)等可以把 referer改变，运营商从中赚钱，但是改变了真实的情况。HTTPS就可以解决这样的问题。Cookie：浏览器给网页提供的本地存储数据的机制(缓存机制)，通过键值对的方式组织。 1> Cookie从哪来？Cookie从服务器来，当浏览器向服务器发起第一次请求时，服务器根据 http响应中的报头(Set-Cookie)字段，决定Cookie要存什么 2> Cookie存在那里？第一次请求时，服务器将Cookie返回给浏览器，浏览器把它存在浏览器缓存中(和硬盘一样)，通过浏览器 + 域名的方式组织大量的 Cookie，不同浏览器的Cookie不同，同一个浏览器的不同域名Cookie也不同。Cookie中内容不仅有键值对，还有过期时间。 3> Cookie往哪去？往服务器去。同一个用户可以开多个窗口，客户端同一时刻很多，那怎么知道哪个客户端上次访问的数据的是什么状态，就是使用Cookie。当浏览器第二次发送相同的域名请求时，会把和第二次请求相同的第一次请求对应的Cookie带上，服务器就可以知道这个请求对应的客户端的状态是怎么样的了。

2> 响应头：响应部分header

响应部分的属性和请求的header大部分一样，但是数据格式不一样：ContentType不同(和响应中body的数据格式对应)。

2.3、空白行:

空白行：get和post请求的空白行功能相同，都是作为header结束的标志

2.4、body:

包括请求体，响应体。 get请求没有请求体，post请求有请求体。 get/post 响应的body 可以是html，css，js，图片…

1> post请求的请求体(body)：

注意：正文(请求体)中的内容格式和响应报文中的分析的 header 中的 Content-Type 密切相关.

application/x-www-form-urlencoded: form 表单提交的数据格式，此时请求体body 的格式如下:

title=test&content=hello

multipart/form-data: form 表单提交的数据格式(在 form 标签中加上 enctyped=“multipart/form-data” . 通常用于提交图片/文件，请求体body格式如下：

Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryrGKCBY7qhFd3TrwA

------WebKitFormBoundaryrGKCBY7qhFd3TrwA

Content-Disposition: form-data; name="text"

title

------WebKitFormBoundaryrGKCBY7qhFd3TrwA

Content-Disposition: form-data; name="file"; filename="chrome.png"

Content-Type: image/png

PNG ... content of chrome.png ...

------WebKitFormBoundaryrGKCBY7qhFd3TrwA--

application/json 数据为 json 格式，请求体body如下：

{"username":"123456789","password":"xxxx","code":"jw7l","uuid":"d110a05ccde64b16

a861fa2bddfdcd15"}

2> get/post 的响应体(body)

在响应头中的Content-Type描述了响应体(body)的数据格式。

text/html 类型的数据 text/css 类型数据 application/javascript 类型数据 application/json 类型数据

例如：application/json类型的响应体如下：

{"msg":"操作成功","code":200,"token":"eyJhbGciOiJIUzUxMiJ9.eyJsb2dpbl91c2VyX2tleSI6IjIxYmU0YTczLTk0ODQtNGIwYi05Mjk1LWJmNTdiMzE2YWVmNSJ9.BrmJEZBh959TxJNi5A8tuG-cVaIBs2i51RKY6dlLjGKfwe3V9rRXt_FRRsdwrQd1pgc0b5jGalYvQLc_Rr60cg"}

3、http协议中可以自定义的属性

1> URL中的路径 2> URL中的 query string 3> header中的键值对 4> header中的Cookie键值对 5> body

三、HTTP请求方法

1、get和post请求的区别(重点)

类型：

get请求的类型： 1> 在浏览器地址栏输入url，回车 2> 在html中的标签 link script img a等 3> 使用ajax get请求，通过ajax异步获取数据，通常返回json数据格式post请求的类型： 1> 登录 2> 上传文件

get和post的区别： get和post，没有本质上的区别，只是在使用习惯上有以下几个区别：

传输数据： GET传输数据通过地址栏上的 query string(查询字符串)；post则通过请求体(body)用法： GET一般用于从服务器获取数据；POST一般用于给服务器提交数据幂等： GET请求通常被设置成幂等的；而POST不要求幂等。幂等就是多次输入相同请求，结果一样。缓存：由于GET被设置成幂等，GET可以被缓存；而POST不能被缓存。

另外1>以前的get请求存在传输上限，而如今rft标标准文档中没有明确的规定。2>不好说post比get更安全，安全应当是由https破除浏览器和服务器的中间人(黑客)来实现了安全(看下面的https加密流程)，而get请求是显示信息在地址栏上，不好说不安全，因为我可以使用加密算法改变后，即使敏感信息出现在地址栏上，别人也看不懂。

2、其它方法

在http方法中，get方法是最常用的，其次是post，其它方法不常用，比如下面几个方法。 DELETE 删除服务器指定资源 OPTIONS 返回服务器所支持的请求方法 HEAD 类似于GET，只不过响应体不返回，只返回响应头 TRACE 回显服务器端收到的请求，测试的时候会用到这个 CONNECT 预留，暂无使用

四、HTTP响应状态码

响应行(状态行，首行)中存在状态行，描述状态。

总的来说状态码可以这样分：

1** hold on（稍候）

2** here you are（成功）

3** go away（重定向）

4** you fucked up（客户端错误）

5** I fucked up（服务器端错误）

需要特殊记住的几个状态码： 200 ok 成功 302 重定向 404 not Found 访问资源不存在 403 forbidden 访问被拒绝(没有权限访问) 405 方法不被允许 (Method not allowed) 表示对应的 http 请求方法没有实现 500 服务器内部错误(代码抛出异常) 504 gateway timeout (浏览器等候服务器响应超时)

夸智网

java-ee 【Java EE】-使用Fiddler抓包以及HTTP的报文格式

python pandas 开发语言接口自动化【三】（接口依赖之上传图片；postman解决依赖的接口；Template 模块用法）

网络运维 linux Web与HTTP

发表评论取消回复

夸智网

java-ee 【Java EE】-使用Fiddler抓包以及HTTP的报文格式

python pandas 开发语言 接口自动化【三】（接口依赖之上传图片；postman解决依赖的接口；Template 模块用法）

网络 运维 linux Web与HTTP

相关文章

发表评论取消回复

python pandas 开发语言接口自动化【三】（接口依赖之上传图片；postman解决依赖的接口；Template 模块用法）

网络运维 linux Web与HTTP