从输入地址到页面加载完成,这一过程是如何完成的?
2017/11/30 人人都是产品经理

    

     作者:流年

     全文共 2697 字,阅读需要 6 分钟

     ———— / BEGIN / ————

     在本文中,我将简单阐述一下“从输入 URL 到页面加载完成的整个过程”。

     作为互联网从业者,不管你属于何种职位,都应该有所了解。

     操作的过程很简单:打开浏览器,在地址栏中键盘输入www.baidu.com ,回车,浏览网页….

     地址栏输入

     当你按输入www.baidu.com ,浏览器接收到这个消息之后,会触发自动完成机制。浏览器根据自己的算法识别出你要访问的URL。

     按下回车键

     此时,回车键的电流回路通过电容器间接地闭合,使得少量的电流进入了键盘的主逻辑电路系统中。

     逻辑电路系统会扫描每个按键的状态,对于按键开关的电位弹跳变化进行解析,并将其转化为键盘码值。

     键盘控制器在得到码值之后,将进行编码。

     编码后,键码值将储存在寄存器内。

     键盘的USB控制器会查询到这个键码值,然后将键码值转换为一个数据包。

     之后,此数据包将通过键盘传递给计算机,计算机把数据包进行解码。

     最后,解码后的按键码值传输到操作系统的硬件层。

     解析URL

     浏览器通过URL可以知道将要使用HTTP协议,和请求资源的主页。

     浏览器会将地址栏中输入的文字传给默认的搜索引擎。把文字传递给搜索引擎的时候,URL会带有特定的一串字符,用来告诉搜索引擎这次搜索来自某个浏览器。

     Unicode(规范字符集)编码转换。如果有非ASCII的字符,将其进行Unicode编码转换。

     检查HSTS列表

     浏览器检查自带的“HSTS(HTTP严格传输安全)”列表,这个列表里包含了那些只使用HTTPS进行连接的网站。

     DNS查询与解析

     浏览器检查域名是否在缓存当中。

     如果缓存中没有,就调用库函数进行查询。库函数在进行DNS解析之前,检查域名是否在本地 Hosts 里。

     如果域名在缓存和Hosts中都没有,库函数会向 DNS 服务器发送一条 DNS 查询请求。

     查询本地的DNS服务器。

     首先查询地址解析协议(ARP)的缓存,如果缓存命中,则返回结果:目标 IP = MAC地址。如果缓存没有命中,就看看目标 IP 地址是不是在本地路由表中的某个子网内,并使用相关接口。然后查询选择的网络接口的MAC地址。

     发送ARP请求,路由器或其他硬件会返回结果(结果中包含默认网关的IP地址)。

     通过TCP/UDP协议向DNS服务器发送相应请求。如果本地DNS服务器没有找到结果,将会逐层查询,直到结果(目标服务器的IP地址)返回。

     使用套接字

     浏览器得到了目标服务器的 IP 地址,以及 URL 中给出来端口号(http默认端口号是80端口)后,浏览器调用库函数socket。

     这个请求将被封装,目标端口会被加入头部。

     在网络层会再加入一个IP头部,里面包含了目标服务器的IP地址以及本机的IP地址。接下来继续封装,将本地内置网卡的MAC地址和本地路由器的MAC地址封装进去。

     此时封装包已经准备就绪。

     接下来,封装包会从本地计算机出发,经过本地网络,再通过调制解调器把数字信号转换成模拟信号。

     在传输线路的另一端,另一个调制解调器把模拟信号转换回数字信号,交由下一网络节点进行处理。

     最终封包会到达目标服务器。

     发送和接收的过程在TCP连接期间会发送很多次(三次握手):客户端将封包发送给服务端,并建立连接设置初始的序列号;服务端收到封包后做相应处理,并且向客户端表明自己接受到了第一个封包;客户端再次发送一个封包来确认这次连接。这就是建立连接三次握手的过程。

     TLS握手

     客户端发送相应消息给服务端,表明可用的加密算法以及压缩算法。

     服务端返回给客户端一个消息,包含了TLS版本,以及自己使用的加密算法和压缩算法等。

     客户端验证服务端发送的信息是否可用,如果可用,就生成一段加密的随机数返给服务端。

     服务端对这段密文进行解密,并生成自己的主密钥。

     接下来整个会话会进行加密,传输http的内容。

     HTTP协议

     浏览器向服务器发送请求头,请求头内容包括:请求数据方式,http版本号,域名等头部信息。

     接下来,服务器端返回一个响应码,表明这次请求的状态。

     浏览器会从自己的缓存中取出想要的内容,在解析完 HTML 之后,浏览器会重复上面的过程,直到HTML页面引入的所有资源(图片、CSS、JS等等)全部都获取完毕。

     浏览器

     当服务器提供了资源之后(HTML,CSS,JS,图片等),浏览器会执行下面的操作:

     HTML解析。HTML解析器的主要工作是对HTML文档进行解析,解析出HTML的内容。

     CSS解析。分析CSS文件内容以及属性值,将每个CSS文件都被解析成一个样式表对象。

     页面渲染。通过一些列计算并呈现DOM树,过程就是测量-排版-绘制页面。在渲染过程中,对图形的渲染处理会使用图形处理器GPU。

     后期渲染

     渲染结束后,浏览器根据时间机制运行JavaScript代码(比如动画)或与用户交互。

     类似Flash和Java的插件也会运行,这些脚本也可能改变网页的内容和布局,并产生又一轮渲染与绘制。

     相关术语理解:

     Unicode。Unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

     HSTS。HTTP Strict Transport Security,国际互联网工程组织IETF正在推行一的种新的Web安全协议。它作用是强制客户端(如浏览器)使用HTTPS与服务器创建连接。

     DNS服务器。Domain Name Server,域名服务器。是进行域名和与之相对应的IP地址转换的服务器。

     Hosts。Hosts是一个没有扩展名的系统文件,可以用记事本等工具打开,其作用就是将一些常用的网址域名与其对应的IP地址建立一个关联“数据库”,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从Hosts文件中寻找对应的IP地址,一旦找到,系统会立即打开对应网页,如果没有找到,则系统会再将网址提交DNS域名解析服务器进行IP地址的解析。

     ARP。地址解析协议。是根据IP地址获取物理地址的一个TCP/IP协议。

     MAC地址。称为物理地址、硬件地址,用来定义网络设备的位置。

     套接字。源IP地址和目的IP地址以及源端口号和目的端口号的组合称为套接字。用于标识客户端请求的服务器。一般用socket函数创建。

     TLS。安全传输层协议,用于在两个通信应用程序之间提供保密性和数据完整性。

     至此,一个完整的从输入 URL 到页面加载完成的过程就走完了。你学会了吗?

     ———— / END / ————

     作者:流年,互联网产品设计师,4年互联网产品设计经验。

     本文由 @流年 原创发布于人人都是产品经理。未经许可,禁止转载

    

    

    http://weixin.100md.com
返回 人人都是产品经理 返回首页 返回百拇医药