书签分享收藏举报版权申诉 / 292

立即下载

当前位置：首页 > 技术资料 > 技术方案 > web应用安全与加速课程讲义.docx

web应用安全与加速课程讲义.docx

上传人：暗伤

文档编号：96871656

上传时间：2024-03-28

格式：DOCX

页数：292

大小：10.81MB

( 4.5 )

《web应用安全与加速课程讲义.docx》由会员分享，可在线阅读，更多相关《web应用安全与加速课程讲义.docx（292页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、Web应用安全与加速讲义1 HTTP1.1 HTTP报文HTTP 报文是在 HTTP 应用程序之间发送的数据块（用于 HTTP 协议交互的信息）。请求端（客户端）的 HTTP 报文叫做请求报文，响应端（服务器端）的叫做响应报文。1.1.0 Debug模式下的HTTP事务URL：Remote Address：访问目标URL解析出来的IP地址，443：表示当前https协议。Referrer Policy : Referrer用户指明当前请求的来源页面，对于同源的请求，会发送完整的url作为引用地址，防盗链。accept：请求可以支持的响应格式列表信息accept-encoding：告知服务器本

2、地浏览器支持是压缩方式sec-fetch-dest：期望获得什么类型的资源sec-fetch-mode ：navigate，表示这是一个浏览器的页面切换请求sec-fetch-site：表示一个请求发起的来源和目标资源来源之间的关系，cross- site：跨域请求，same-origin：同源请求。sec-fetch-user：？1表示的trueupgrade-insecure-requests :1,表示当前浏览器告诉服务器，浏览器是可以处理https请求的，即使访问的https请求中又包含了其他的http请求。user-agent：描述浏览器的信息server ：web应用程序部署的容器

3、，openresty：封装了Nginx以及第三方的类库，Lua语言，redis等等。vary ：accept-Encoding，告诉代理服务器缓存两种版本的资源（压缩、不压缩）1.1.1 报文流动HTTP 使用术语流入（inbound）和流出（outbound）来描述事务处理（transaction）的方向。报文流入源端服务器，工作完成之后，会流回用户的 Agent 代理中报文流入源端服务器并流回到客户端1.1.2 报文的组成部分HTTP 报文是简单的格式化数据块。每条报文都包含一条来自客户端的请求，或者一条来自服务器的响应。它们由三个部分组成：1. 对报文进行描述的起始行（st

4、art line）2. 包含属性的首部（header）块3. 以及可选的包含数据的主体（body）部分（1）所有的 HTTP 报文都可以分为两类：请求报文（request message）和响应报文（response message）。请求报文会向 Web 服务器请求一个动作。响应报文会将请求的结果返回给客户端。请求和响应报文的基本报文结构相同。这是请求报文的格式：这是响应报文的格式（注意，只有起始行的语法有所不同）：（2）请求报文（3）响应报文（4） HTTP消息由采用ASCII编码的多行文本构成。在HTTP/1.1及早期版本中，这些消息通过连接公开地发送。在HTTP/2

5、中，为了优化和性能方面的改进，曾经可人工阅读的消息被分到多个HTTP帧中。Web 开发人员或网站管理员，很少自己手工创建这些原始的HTTP消息由软件、浏览器、代理或服务器完成。他们通过配置文件（用于代理服务器或服务器），API （用于浏览器）或其他接口提供HTTP消息。（5） HTTP 请求和响应具有相似的结构，由以下部分组成1. 一行起始行用于描述要执行的请求，或者是对应的状态，成功或失败，这个起始行总是单行的。2. 一个可选的HTTP头集合指明请求或描述消息正文。3. 一个空行指示所有关于请求的元数据已经发送完毕。4. 一个可选的包含请求相关数据的正文 (比如HTML表单内容)，或者响

6、应相关的文档。正文的大小有起始行的HTTP头来指定。起始行和 HTTP 消息中的HTTP 头统称为请求头，而其有效负载被称为消息正文。1.1.3 HTTP请求（1）起始行HTTP请求是由客户端发出的消息，用来使服务器执行动作。起始行 (start-line)包含三个元素：PUTHEADGET1. 一个 HTTP 方法，一个动词 ( GET ,或者 POST ) 或者一个名词 (像或者 OPTIONS ), 描述要执行的动作. 例如,示向服务器推送数据 (创建或修改资源)。表示要获取资源， POST 表2. 请求目标 (request target)，通常是一个URL，或者是协议、端口和域名

7、的绝对路径，通常以请求的环境为特征。请求的格式因不同的 HTTP 方法而异。它可以是：GET一个完整的URL，被称为绝对形式 (absolute form)，主要在使用方法连接到代理时使用。GET http:/developer.mozilla.org/en-US/docs/Web/HTTP/Messages HTTP/1.1由域名和可选端口（以: 为前缀）组成的 URL 的 authorityCONNECTcomponent，称为 authority form。仅在使用道时才使用。建立 HTTP 隧CONNECT developer.mozilla.org:80 HTTP/1.1OPTI

8、ONS * HTTP/1.1OPTIONS星号形式 (asterisk form)，一个简单的星号( * )，配合方法使用，代表整个服务器。3. HTTP 版本 (HTTP version)，定义了剩余报文的结构，作为对期望的响应版本的指示符。（2） Headers(:)来自请求的 HTTP headers遵循和 HTTP header 相同的基本结构：不区分大小写的字符串，紧跟着的冒号和一个结构取决于 header 的值。整个header（包括值）由一行组成，这一行可以相当长。（3） Body请求的最后一部分是它的 body。不是所有的请求都有一个 body：例如获取资源的请求，GET，H

9、EAD，DELETE 和 OPTIONS，通常它们不需要 body。有些请求将数据发送到服务器以便更新数据：常见的的情况是 POST 请求（包含 HTML 表单数据）。1.1.4 HTTP响应（1）状态行HTTP 响应的起始行被称作状态行 (status line)，包含以下信息：HTTP/1.1。1. 协议版本，通常为2. 状态码 (status code)，表明请求是成功或失败。常见的状态码是 200 ，404 ，或 302 。3. 状态文本 (status text)。一个简短的，纯粹的信息，通过状态码的文本描述，帮助人们理解该 HTTP 消息。一个典型的状态行看起来像这样： HT

10、TP/1.1 404 Not Found 。（2） Headers响应的 HTTP headers：不区分大小写的字符串，紧跟着的冒号 ( : ) 和一个结构取决于 header 类型的值。整个 header（包括其值）表现为单行形式。（3） Body响应的最后一部分是 body。不是所有的响应都有 body。1.1.5 HTTP请求方法请求的起始行以方法作为开始，方法用来告知服务器要做些什么。（1） GETGET 是最常用的方法。通常用于请求服务器发送某个资源。 HTTP/1.1 要求服务器实现此方法。（2） HEADHEAD 方法与 GET 方法的行为很类似，但服务器在响应中只返回

11、首部。不会返回实体的主体部分。这就允许客户端在未获取实际资源的情况下，对资源的首部进行检查。使用 HEAD，可以：在不获取资源的情况下了解资源的情况（比如，判断其类型）；通过查看响应中的状态码，看看某个对象是否存在；通过查看首部，测试资源是否被修改了。服务器开发者必须确保返回的首部与 GET 请求所返回的首部完全相同。遵循HTTP/1.1 规范，就必须实现 HEAD 方法。（3） PUT与 GET 从服务器读取文档相反， PUT 方法会向服务器写入（更新）文档。PUT 方法的语义就是让服务器用请求的主体部分来创建一个由所请求的 URL 命名的新文档，或者，如果那

12、个 URL 已经存在的话，就用这个主体来替代它。（4） POSTPOST 方法起初是用来向服务器输入数据的。实际上，通常会用它来支持HTML的表单。表单中填好的数据通常会被送给服务器处理。（5） TRACETRACE客户端发起一个请求时，这个请求可能要穿过防火墙、代理、网关或其他一些应用程序。每个中间节点都可能会修改原始的 HTTP 请求。 TRACE 方法允许客户端在最终将请求发送给服务器时，看看它变成了什么样子。TRACE 请求会在目的服务器端发起一个“环回” 诊断。行程最后一站的服务器会弹回一条 TRACE 响应，并在响应主体中携带它收到的原始请求报文。这样客户

13、端就可以查看在所有中间 HTTP 应用程序组成的请求 / 响应链上，原始报文是否，以及如何被毁坏或修改过TRACE 方法主要用于诊断；也就是说，用于验证请求是否如愿穿过了请求 / 响应链。（6） OPTIONSOPTIONS 方法请求 Web 服务器告知其支持的各种功能。可以询问服务器通常支持哪些方法，或者对某些特殊资源支持哪些方法。（7） DELETEDELETE 方法所做的事情就是请服务器删除请求 URL 所指定的资源。1.1.6 状态码方法是用来告诉服务器做什么事情的，状态码则用来告诉客户端，事情执行的结果。状态码位于响应的起始行中。服务器通常会返回一个数字状态和一个可读

14、的状态。数字码便于程序进行差错处理，而原因短语则更便于人们理解。200 到 299 之间的状态码表示成功。300 到 399 之间的代码表示资源已经被移走400 到 499 之间的代码表示客户端的请求出错500 到 599 之间的代码表示服务器出错状态码分类：常见状态码：（1）成功状态码客户端发起请求时，这些请求通常都是成功的。服务器有一组用来表示成功的状态码，分别对应于不同类型的请求。（2）重定向状态码重定向状态码要么告知客户端使用替代位置来访问他们所感兴趣的资源，要么就提供一个替代的响应而不是资源的内容。如果资源已被移动，可发送一个重定向状态码告知客户端资源已被移走，以

15、及现在可以在哪里找到目标资源。使用场景：web应用支持https，客户端访问，服务器收到请求之后（Nginx）发现请求的是http请求，可以返回301告知浏览器重新发出请求。重定向状态码与原因短语：301 redirect: 301 代表永久性转移(Permanently Moved)302 redirect: 302 代表暂时性转移(Temporarily Moved )301和302状态码都表示重定向，就是说浏览器在拿到服务器返回的这个状态码后会自动跳转到一个新的URL地址，这个地址可以从响应的Location首部中获取（用户看到的效果就是他输入的地址A瞬间变成了另一个地址B）这是它们的共

16、同点。他们的不同在于。301表示旧地址A的资源已经被永久地移除了（这个资源不可访问了），搜索引擎在抓取新内容的同时也将旧的网址交换为重定向之后的网址；302表示旧地址A的资源还在（仍然可以访问），这个重定向只是临时地从旧地址A跳转到地址B，搜索引擎会抓取新的内容而保存旧的网址。（3）客户端错误状态码有时客户端会发送一些服务器无法处理的东西，比如格式错误的请求报文，或者最常见的是，请求一个不存在的 URL。浏览网页时，我们都看到过臭名昭著的 404 Not Found 错误码这只是服务器在告诉我们，它对我们请求的资源一无所知。状态码原因短语含义400 Bad Request用千告知客

17、户端它发送了一个错误的请求401 Unauthorized与适当的首部一同返回，在这些首部中请求客户端在获取对资源的访问权之前，对自已进行认证。更多有关认证的内容请参见12.1节402 Payment Required现在这个状态码还未使用，但已经被保留，以作未来之用403 Forbidden用千说明请求披服务器拒绝了。如果服务器想说明为什么拒绝请求，可以包含实体的主体部分来对原因进行描述。但这个状态码通常是在股务器不想说明拒绝原因的时候使用的404 Not Found用千说明股务器无法找到所请求的URL。通常会包含一个实体，以便客户端应用程序显示给用户看405 Method Not Allo

18、wed发起的请求中带有所请求的URL不支持的方法时，使用此状态码。应该在响应中包含Allow首部，以告知客户端对所请求的资源可以使用哪些方法。更多有关Allow首部的信息请参见3.5.4节406 Not Acceptable客户端可以指定参数来说明它们愿意接收什么类型的实体。服务器没有与客户端可接受的URL相匹配的资源时，使用此代码。通常，股务器会包含一些首部，以便客户端弄清楚为什么请求无法满足。更多信息请参见第17407 Proxy Authentication与401状态码类似，但用千要求对资源进行认证的代理服务器Required408 Request Timeout如果客户端完成请求所花

19、的时间太长，服务器可以回送此状态码，井关闭连接。超时时长随服务器的不同有所不同，但通常对所有的合法请求来说，都是够长的409 Conflict用千说明请求可能在资源上引发的一些冲突。服务器担心请求会引发冲突时，可以发送此状态码。响应中应该包含描述冲突的主体（4）服务器错误状态码有时客户端发送了一条有效请求，服务器自身却出错了。这可能是客户端碰上了服务器的缺陷，或者服务器上的子元素，比如某个网关资源，出了错。代理尝试着代表客户端与服务器进行交流时，经常会出现问题。1.2 连接管理1.2.1 TCP连接HTTP 通信由 TCP/IP 承载的， TCP/IP 是全球计算机及网络设备都在

20、使用的一种常用的分组交换网络分层协议集。客户端应用程序可以打开一条 TCP/IP 连接，连接到可能运行在世界任何地方的服务器应用程序。一旦连接建立，在客户端和服务器的计算机之间交换的报文就永远不会丢失、受损或失序。1.2.1.1 三步握手TCP协议目的是为了保证数据能在两端准确连续的流动，可以想象两个建立起 TCP通道的设备就如同接起了一根水管，数据就是水管中的水由一头流向另一头。然而TCP为了能让一个设备连接多根“水管”，让一个设备能同时与多个设备交互信息，它必须要保证不同水管之间不会产生串联或相互影响为了确保数据能够正确分发，TCP用一种叫做TCB，也叫传输控制块的数据结构把发给不

21、同设备的数据封装起来，我们可以把该结构看做是信封。一个TCB数据块包含了数据发送双方对应的socket信息以及拥有装载数据的缓冲区。在两个设备要建立连接发送数据之前，双方都必须要做一些准备工作，分配内存建立起TCB数据块就是连接建立前必须要做的准备工作。（0）准备工作最开始的时候客户端和服务器都是处于CLOSED状态。主动打开连接的为客户端，被动打开连接的是服务器。TCP服务器进程先创建传输控制块TCB，时刻准备接受客户进程的连接请求，此时服务器就进入了LISTEN（监听）状态（1）一次握手：TCP客户进程也是先创建传输控制块TCB，然后向服务器发出连接请求报文，这是报文首部中的同部位SY

22、N=1，同时选择一个初始序列号 seq=x 。此时，TCP客户端进程进入了 SYN-SENT（同步已发送状态）状态。TCP规定，SYN报文段（SYN=1的报文段）不能携带数据，但需要消耗掉一个序号。（2）二次握手：TCP服务器收到请求报文后，如果同意连接，则发出确认报文。确认报文中应该 ACK=1，SYN=1，确认号是ack=x+1，同时也要为自己初始化一个序列号 seq=y，此时，TCP服务器进程进入了SYN-RCVD（同步收到）状态。这个报文也不能携带数据，但是同样要消耗一个序号。ACK为1表示确认号有效，为0表示报文中不包含确认信息（3）三次握手：TCP客户进程收到确认后，还要向服务

23、器给出确认。确认报文的ACK=1， ack=y+1，自己的序列号seq=x+1，此时，TCP连接建立，客户端进入 ESTABLISHED（已建立连接）状态。TCP规定，ACK报文段可以携带数据，但是如果不携带数据则不消耗序号。当服务器收到客户端的确认后也进入established状态，此后双方就可以开始通信了。注：tcp建立连接需要三次握手，SYN是发送标志位，ACK是确认标志位.为什么TCP客户端最后还要发送一次确认呢？主要防止已经失效的连接请求报文突然又传送到了服务器，从而产生错误。如果使用的是两次握手建立连接，假设有这样一种场景，客户端发送了第一个请求连接并且没有丢失，只是因为在网络结点

24、中滞留的时间太长了，由于TCP的客户端迟迟没有收到确认报文，以为服务器没有收到，此时重新向服务器发送这条报文，此后客户端和服务器经过两次握手完成连接，传输数据，然后关闭连接。此时此前滞留的那一次请求连接，网络通畅了到达了服务器，这个报文本该是失效的，但是，两次握手的机制将会让客户端和服务器再次建立连接，这将导致不必要的错误和资源的浪费。如果采用的是三次握手，就算是那一次失效的报文传送过来了，服务端接受到了那条失效报文并且回复了确认报文，但是客户端不会再次发出确认。由于服务器收不到确认，就知道客户端并没有请求连接。为什么要3次握手?换个易于理解的视角来看为什么要3次握手。客户端和服务端通信前要进

25、行连接，3次握手的作用就是双方都能明确自己和对方的收、发能力是正常的。第一次握手：客户端发送网络包，服务端收到了。这样服务端就能得出结论：客户端的发送能力、服务端的接收能力是正常的。第二次握手：服务端发包，客户端收到了。这样客户端就能得出结论：服务端的接收、发送能力，客户端的接收、发送能力是正常的。从客户端的视角来看，我接到了服务端发送过来的响应数据包，说明服务端接收到了我在第一次握手时发送的网络包，并且成功发送了响应数据包，这就说明，服务端的接收、发送能力正常。而另一方面，我收到了服务端的响应数据包，说明我第一次发送的网络包成功到达服务端，这样，我自己的发送和接收能力也是正常的。第三次握手：

26、客户端发包，服务端收到了。这样服务端就能得出结论：客户端的接收、发送能力，服务端的发送、接收能力是正常的。第一、二次握手后，服务端并不知道客户端的接收能力以及自己的发送能力是否正常。而在第三次握手时，服务端收到了客户端对第二次握手作的回应。从服务端的角度，我在第二次握手时的响应数据发送出去了，客户端接收到了。所以，我的发送能力是正常的。而客户端的接收能力也是正常的。经历了上面的三次握手过程，客户端和服务端都确认了自己的接收、发送能力是正常的。之后就可以正常通信了。1.2.1.2 TCP协议缺陷DDOS又称为分布式拒绝服务，全称是Distributed Denial of Service。DD

27、OS本是利用合理的请求造成服务器资源过载，导致服务不可用。常见的DDOS攻击有 SYN flood（SYN flood）、UDP flood、ICMP、flood等，其中SYN flood是一种最为经典的DDOS攻击。SYN flood如此猖獗是因为它利用了TCP协议设计中的缺陷，而TCP/IP协议是整个互联网的基础，牵一发而动全身，如今想要修复这样的缺陷几乎成为不可能的事情。SYN flood攻击原理：1. SYN flood在攻击时，首先伪造大量的源IP地址，分别向服务器端发送大量的SYN包。2. 服务器端返回SYN/ACK包，因为源地址是伪造的，所以伪造的IP并不会应答。3. 服务器端没

28、有收到伪造IP的回应，会重试35次并且等待一个SYN Time（般为30秒至2分钟），如果超时则丢弃这个连接。4. 攻击者大量发送这种伪造源地址的SYN请求，服务器端将会消耗非常多的资源来处理这种半连接，同时还要不断地对这些IP进行SYN+ACK重试。5. 最后的结果是服务器无暇理睬正常的连接请求，导致拒绝服务。1.2.1.3 四次挥手数据传输完毕后，双方都可释放连接。最开始的时候，客户端和服务器都是处于established（表示连接已经建立）状态，然后客户端主动关闭，服务器被动关闭。1. 客户端进程发出连接释放报文，并且停止发送数据。释放数据报文首部， FIN=1（FIN表示关闭连接，SY

29、N表示建立连接），其序列号为seq=u（等于前面已经传送过来的数据的最后一个字节的序号加1），此时，客户端进入 FIN-WAIT-1（终止等待1）状态。 TCP规定，FIN报文段即使不携带数据，也要消耗一个序号。2. 服务器收到连接释放报文，发出确认报文，ACK=1，ack=u+1（确认序号为收到的序号加1），并且带上自己的序列号seq=v，此时，服务端就进入了 CLOSE-WAIT（关闭等待）状态。TCP服务器通知高层的应用进程，客户端向服务器的方向就释放了，这时候处于半关闭状态，即客户端已经没有数据要发送了，但是服务器若发送数据，客户端依然要接受。这个状态还要持续一段时间，也就是整个CLO

30、SE-WAIT状态持续的时间。CLOSE_WAIT：表示在等待关闭状态3. 客户端收到服务器的确认请求后，此时，客户端就进入FIN-WAIT-2（终止等待2）状态，等待服务器发送连接释放报文（在这之前还需要接受服务器发送的最后的数据）。4. 服务器将最后的数据发送完毕后，就向客户端发送连接释放报文，FIN=1， ack=u+1，由于在半关闭状态，服务器很可能又发送了一些数据，假定此时的序列号为seq=w，此时，服务器就进入了LAST-ACK（最后确认）状态，等待客户端的确认。5. 客户端收到服务器的连接释放报文后，必须发出确认，ACK=1，ack=w+1，而自己的序列号是seq=u+1，此时，

31、客户端就进入了TIME-WAIT（时间等待）状态。注意此时TCP连接还没有释放，必须经过2*MSL（最长报文段寿命）的时间后，当客户端撤销相应的TCB后，才进入CLOSED状态。6. 服务器只要收到了客户端发出的确认，立即进入CLOSED状态。同样，撤销 TCB后，就结束了这次的TCP连接。可以看到，服务器结束TCP连接的时间要比客户端早一些。FIN_WAIT_1和FIN_WAIT_2状态的真正含义都是表示等待对方的FIN报文。而这两种状态的区别是：FIN_WAIT_1状态实际上是当SOCKET在 ESTABLISHED状态时，它想主动关闭连接，向对方发送了FIN报文，此时该 SOCKET即

32、进入到FIN_WAIT_1状态。而当对方回应ACK报文后，则进入到 FIN_WAIT_2状态四次挥手简洁版：（1） TCP客户端发送一个FIN，用来关闭客户到服务器的数据传送。（2）服务器收到这个FIN，它发回一个ACK，确认序号为收到的序号加1。和SYN一样，一个FIN将占用一个序号。（3）服务器关闭客户端的连接，发送一个FIN给客户端。（4）客户端发回ACK报文确认，并将确认序号设置为收到序号加1。为什么客户端最后还要等待2MSL？MSL（Maximum Segment Lifetime），TCP允许不同的实现可以设置不同的MSL值。去向ACK消息最大存活时间（MSL) + 来向FI

33、N消息的最大存活时间(MSL)。这恰恰就是*2MSL( Maximum Segment Life)。第一，保证客户端发送的最后一个ACK报文能够到达服务器，因为这个ACK报文可能丢失，站在服务器的角度看来，我已经发送了FIN+ACK报文请求断开了，客户端还没有给我回应，应该是我发送的请求断开报文它没有收到，于是服务器又会重新发送一次，而客户端就能在这个2MSL时间段内收到这个重传的报文，接着给出回应报文，并且会重启2MSL计时器。第二，等待2MSL时间，客户端就可以放心地释放TCP占用的资源、端口号。如果不等，释放的端口可能会重连刚断开的服务器端口，这样依然存活在网络里的老的TCP报文可能与新

34、TCP连接报文冲突，造成数据冲突，为避免此种情况，需要耐心等待网络老的TCP连接的活跃报文全部死翘翘，2MSL时间可以满足这个需求（尽管非常保守）！为什么建立连接是三次握手，关闭连接确是四次挥手呢？建立连接的时候，服务器在LISTEN状态下，收到建立连接请求的SYN报文后，把ACK和SYN放在一个报文里发送给客户端。关闭连接时，服务器收到对方的FIN报文时，仅仅表示对方不再发送数据了但是还能接收数据，而自己也未必已经将全部数据都发送给对方了，所以己方可以立即关闭，也可以发送一些数据给对方后，再发送FIN报文给对方来表示同意现在关闭连接，因此，己方ACK和FIN一般都会分开发送，从而导致多了一

35、次。如果已经建立了连接，但是客户端突然出现故障了怎么办？TCP还设有一个保活计时器，显然，客户端如果出现故障，服务器不能一直等下去，白白浪费资源。服务器每收到一次客户端的请求后都会重新复位这个计时器，时间通常是设置为2小时，若两小时还没有收到客户端的任何数据，服务器就会发送一个探测报文段，以后每隔75秒发送一次。若一连发送10个探测报文仍然没反应，服务器就认为客户端出了故障，接着就关闭连接。1.2.2 TCP数据传输1.2.2.1 传输原理TCP通过 “ 发送应答（ACK确认）”来确保传输的可靠性，它是端到端传输的。TCP传输是分段的，一个HTTP响应报文会被操作系统切成多个 MSS（Ma

36、ximum Segment Size）大小的段，直到接收端接受到完整的报文为止。在此过程中，报文分段按照顺序进行发送，每个报文段在发送时，会做顺序编号，以便能够完整正确地组装。MSS:Maximum Segment Size 最大报文段长度,是TCP协议的一个选项，用于在TCP连接建立时，收发双方协商通信时每一个报文段所能承载的最大数据长度（不包括文段头）。如果MSS选项数据为512，则表示该报文段的发送方可以处理的最大报文段长度为512字节（不包括TCP与IP协议头长度）。主机一般默认MSS为536字节端口号：表示同一个计算机上的不同进程源端口号和目标端口号都是占用了两个字节TCP的源端口号

37、和目标端口号预计IP报文中的源IP和目标IP确认一条唯一的TCP连接序号：4个字节确认序号：ack，占四个字节控制位：URG、ACK、PSH、RST、SYN、FINTCP 的数据是通过名为 IP 分组（或 IP 数据报）的小数据块来发送的。HTTP就是“HTTP over TCP over IP” 这个“协议栈” 中的最顶层了。其安全版本 HTTPS就是在 HTTP 和 TCP 之间插入了一个（称为 TLS 或 SSL的）密码加密层。HTTP 要传送一条报文时，会以流的形式将报文数据的内容通过一条打开的 TCP 连接按序传输。 TCP 收到数据流之后，会将数据流砍成被称作段的小数

38、据块，并将段封装在 IP 分组中，通过因特网进行传输。所有这些工作都是由 TCP/IP 软件来处理的， HTTP 程序员什么都看不到。每个 TCP 段都是由 IP 分组承载，从一个 IP 地址发送到另一个 IP 地址的。每个 IP分组中都包括：一个 IP 分组首部（通常为 20 字节）一个 TCP 段首部（通常为 20 字节）一个 TCP 数据块（0 个或多个字节）IP 首部包含源和目的 IP 地址、长度和其他一些标记。 TCP 段的首部包含了TCP端口号、 TCP 控制标记，以及用于数据排序和完整性检查的一些数字值。TCP 连接是通过 4 个值来识别的：这 4 个值一起唯一地定

39、义了一条连接。两条不同的 TCP 连接不能在同一时刻拥有 4 个完全相同的地址组件值有些连接共享了相同的目的端口号（C 和 D 都使用目的端口号 80）。有些连接使用了相同的源 IP 地址（B 和 C）。有些使用了相同的目的 IP 地址（A 和 B， C和 D）。但没有两个不同连接所有的 4 个值都一样。1.2.2.2 滑动窗口协议将TCP与UDP这样的简单传输协议区分开来的两种协议不同的传输数据的质量。TCP对于发送数据进行跟踪，这种数据管理需要协议有以下两大关键功能：可靠性：保证数据确实到达目的地。如果未到达，能够发现并重传。数据流控：管理数据的发送速率，以使接收设备不致于过载。要

40、完成这些任务，整个协议操作是围绕滑动窗口确认机制来进行的。因此，理解了滑动窗口，也就是理解了TCP。（1）在我们滑动窗口协议之前，我们如何来保证发送方与接收方之间，每个包都能被收到，并且是按次序的呢？问题：吞吐量非常的低。我们发完包1，一定要等确认包1，我们才能发送第二个包。（2）那么我们就不能先连发几个包等他一起确认吗？这样的话速度更快，吞吐量更高问题：如果过多的源同时以很快的速度发送大量的数据包，而此时接收方并没有如此高的接收数据的能力，因此极易导致网络的拥塞。（3）滑动窗口协议（Sliding Window Protocol）该协议是 TCP协议的一种应用，用于网络数据传输时的流

41、量控制，以避免拥塞的发生。该协议允许发送方在停止并等待确认前发送多个数据分组。由于发送方不必每发一个分组就停下来等待确认。因此该协议可以加速数据的传输，提高网络吞吐量。滑动窗口算法其实和这个是一样的，只是用的地方场景不一样。如果我们在任一时间点对于这一过程做一个“快照”，那么我们可以将TCP buffer中的数据分为以下四类，并把它们看作一个时间轴：1. 已发送已确认数据流中最早的字节已经发送并得到确认。这些数据是站在发送设备的角度来看的。2. 已发送但尚未确认已发送但尚未得到确认的字节。发送方在确认之前，不认为这些数据已经被处理。3. 未发送而接收方已Ready 设备尚未将数据发出，但接

42、收方根据最近一次关于发送方一次要发送多少字节确认自己有足够空间。发送方会立即尝试发送。4. 未发送而接收方Not Ready 由于接收方not ready，还不允许将这部分数据发出。说明：灰色1号2号3号包已经发送完毕，并且已经收到Ack。这些包就已经是过去式。4、5、6号包是黄色的，表示已经发送了。但是并没有收到对方的Ack，所以也不知道接收方有没有收到。7、8、9号包是淡蓝色的。是我们还没有发送的。这些淡蓝色也就是我们接下来马上要发送的包。后面的10-15还没有被读进内存。要等4号-9号包有接下来的动作后，我们的包才会继续往下发送。正常情况：可以看到4号包对方已经被接收到，所以被涂成了灰色

43、。“窗口”就往右移一格。我们就把11号包读进了我们的缓存。进入了“待发送”的状态。8、9号包已经变成了黄色，表示已经发送出去了。接下来的操作就是一样的了，确认包后，窗口往后移继续将未发送的包读进缓存，把“待发送“状态的包变为”已发送“。丢包情况：有可能我们包（5-11）发过去，对方的Ack丢了。也有可能我们的包并没有发送过去。从发送方角度看就是我们没有收到Ack。发生的情况：一直在等Ack。如果一直等不到的话，我们也会把读进缓存的待发送的包也一起发过去。但是，这个时候我们的窗口已经发满了。所以并不能把 12号包读进来，而是始终在等待5号包的Ack。问题：如果我们这个Ack始终不来怎么办呢？超时

44、重发/重传：原理是在发送某一个数据以后就开启一个计时器，在一定时间内如果没有得到发送的数据报的ACK报文，那么就重新发送数据，直到发送成功为止。影响超时重传机制协议效率的一个关键参数是重传超时时间（RTO， Retransmission TimeOut）。RTO的值被设置过大过小都会对协议造成不利影响。RTO设长了，重发就慢，没有效率，性能差。RTO设短了，重发的就快，会增加网络拥塞，导致更多的超时，更多的超时导致更多的重发。连接往返时间（RTT，Round Trip Time），指发送端从发送TCP包开始到接收它的立即响应所消耗的时间。在 Unix 以及 Windows 系统中，最初其重发超

45、时的默认值一般设置为6秒（重发时间必须是0.5秒的倍数）左右。数据被重发之后若还是收不到确认应答，则进行再次发送。此时，等待确认应答的时间将会以2倍、4倍的指数函数延长。此外，数据也不会被无限、反复地重发。达到一定重发次数之后，如果仍没有任何确认应答返回，就会判断为网络或对端主机发生了异常，强制关闭连接，并且通知应用通信异常强行终止。1.2.3 TCP性能HTTP 紧挨着 TCP，位于其上层，所以 HTTP 事务的性能在很大程度上取决于底层TCP 通道的性能。HTTP 事务的时延有以下几种主要原因。(1) 通过 DNS 解析系统将 URI 中的主机名转换成一个 IP地址要花费对应的时间(2

46、) 每条新的 TCP 连接都会有连接建立时延，但如果有数百个 HTTP 事务的话，这个时间消耗值会快速地叠加上去。(3) 网络传输请求报文及服务器处理请求报文都需要时间。(4) Web 服务器会回送 HTTP 响应的花费时间。这些网络时延的大小取决于硬件速度、网络和服务器的负载，请求和响应报文的尺寸，以及客户端和服务器之间的距离。 TCP 协议的技术复杂性也会对时延产生巨大的影响。性能聚焦区域：TCP 连接建立握手； TCP 慢启动拥塞控制； TCP 延迟确认算法； Nagle 算法；（1） TCP连接的握手时延TCP 连接握手需要经过以下几个步骤。(1) 请求新的 TCP 连接时，客户端要向服务器发送一个小的 TCP 分组（通常是 40 60 个字节）。这个分组中设置了一个特殊的 SYN 标记，说明这是一个连接请求。(2) 如果服务器接受了连接，就会对一些连接参数进行计算，并向客户端回送一个TCP 分组，这个分组

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

50 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: web 应用安全加速课程讲义

得力文库 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：web应用安全与加速课程讲义.docx
链接地址：https://www.deliwenku.com/p-96871656.html