写在前面

本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和文献引用请见100个问题搞定大数据理论体系

解答

1. HTTP重定向
2. DNS域名解析
3. 反向代理服务器
4. 网络层
5. 链路层

补充

HTTP重定向

负载均衡服务器使用某种负载均衡算法计算得到服务器的P地址之后,将该地址写入HTTP重定向报文中,状态码为302。

客户端收到重定向报文之后,需要重新向服务器发起请求。

缺点

  1. 需要两次请求,因此访问延迟比较高;
  2. HTTP负载均衡器处理能力有限,会限制集群的规模。

使用场景

该负载均衡转发的缺点比较明显,实际场景中很少使用它。

DNS域名解析

在DNS解析域名的同时使用负载均衡算法计算服务器IP地址。

优点

DNS能够根据地理位置进行域名解析,返回离用户最近的服务器IP地址

缺点

由于DNS具有多级结构,每一级的域名记录都可能被缓存,当下线一台服务器需要修改DNS记录时,需要过很长一段时间才能生效。

使用场景

大型网站基本使用了DNS做为第一级负载均衡手段,然后在内部使用其它方式做第二级负载均衡。

也就是说,域名解析的结果为内部的负载均衡服务器IP地址。

反向代理服务器

反向代理服务器位于源服务器前面,用户的请求需要先经过反向代理服务器才能到达源服务器。

反向代理可以用来进行缓存、日志记录等,同时也可以用来做为负载均衡服务器。

在这种负载均衡转发方式下,客户端不直接请求源服务器,因此源服务器不需要外部IP地址,而反向代理需要配置內部和外部两套IP地址。

优点

与其它功能集成在一起,部署简单。

缺点

所有请求和响应都需要经过反向代理服务器,它可能会成为性能瓶颈。

网络层

在操作系统内核进程获取网络数据包,根据负载均衠算法计算源服务器的P地址,并修改请求数据包的目的IP地址,最后进行转发。

源服务器返回的响应也需要经过负载均衡服务器,通常是让负载均衡服务器同时作为集群的网关服务器来实现。

优点

在内核进程中进行处理,性能比较高。

缺点

和反向代理一样,所有的请求和响应都经过负载均衡服务器,会成为性能瓶颈。

链路层

在链路层根据负载均衡算法计算源服务器的MAC地址,并修改请求数据包的目的MAC地址,并进行转发。

通过配置源服务器的虚拟IP地址和负载均衡服务器的IP地址一致,从而不需要修改IP地址就可以进行转发。

优点

也正因为IP地址一样,所以源服务器的响应不需要转发回负载均衡服务器,可以直接转发给客户端,避免了负载均衡服务器的成为瓶颈。

这是一种三角传输模式,被称为直接路由。

对于提供下载和视频服务的网站来说,直接路由避免了大量的网络传输数据经过负载均衡服务器。

使用场景

这是目前大型网站使用最广负载均衡转发方式,在 Linux平台可以使用的负载均衡服务器为LVS(Linux Virtual Server)

Q.E.D.


Apache Spark Contributor