HAProxy
HAProxy: 是法国开发者Willy Tarreau开发的一个开源软件,是一款具备高并发、高性能的TCP和HTTP负载均衡器,支持基于cookie的持久性,自动故障切换,支持正则表达式及web状态统计。
LB Cluster:
- 四层:lvs, nginx(stream模式且nginx1.9.0或更新版本),haproxy(mode tcp)
- 七层:http: nginx(http), haproxy(mode http), httpd…
HAProxy功能
HAProxy是TCP / HTTP反向代理服务器,尤其适合于高可用性高并发环境
- 可以针对HTTP请求添加cookie,进行路由后端服务器
- 可平衡负载至后端服务器,并支持持久连接
- 支持基于cookie进行调度
- 支持所有主服务器故障切换至备用服务器
- 支持专用端口实现监控服务
- 支持不影响现有连接情况下停止接受新连接请求
- 可以在双向添加,修改或删除HTTP报文首部
- 支持基于pattern实现连接请求的访问控制
- 通过特定的URI为授权用户提供详细的状态信息
使用HAProxy
安装启动haproxy
编译安装
1 | [root@master haproxy-1.8.17]# yum install gcc gcc-c++ glibc glibc-devel pcre pcre-devel openssl openssl-devel systemd-devel net-tools vim iotop bc zip unzip zlib-devel lrzsz tree screen lsof tcpdump wget ntpdate #解决依赖关系 |
在编译的过程中会在当前目录生成一个haproxy可执行程序,将其拷贝到/usr/sbin/目录下。
创建启动文件
1 | [root@master haproxy-1.8.17]# vi /usr/lib/systemd/system/haproxy.service |
创建配置文件
1 | [root@master haproxy]# cat /etc/haproxy/haproxy.cfg |
创建目录和用户
1 | [root@master haproxy-1.8.17]# mkdir /etc/haproxy |
haproxy.cfg文件中定义了chroot、pidfile、user、group等参数,如果系统没有相应的资源会导致haproxy无法启动,具体参考日志文件/var/log/messages
启动haproxy
1 | ~]# systemctl daemon-reload |
haproxy基本配置
HAProxy组成
程序环境
- 主程序:/usr/sbin/haproxy
- 配置文件:/etc/haproxy/haproxy.cfg
- unit file:/usr/lib/systemd/system/haproxy.service
配置段:
- global:全局配置段
进程及安全配置相关的参数
性能调整相关的参数
debug参数
1 | chroot #锁定运行目录,当haproxy被侵入,则只能在锁定目录活动,能保护系统上的其他目录不受侵害。 |
- proxies:代理配置段
defaults:为frontend,backend,listen提供默认配置
frontend <\name>:前端,相当于nginx中的server{}
backend <\name>:后端,相当于nginx中的upstream{}
listen <\name>:同时拥有前端和后端,适用于一对一环境。
注意:name字段只能用”-“,”.”,”、”,”:”,并严格区分大小写,例如:Web和web时完全不同的两组服务器。
defaults[<\name>] #默认配置项,针对以下的frontend、backend和listen生效,可以多个name
1 | option redispatch #当server Id对应的服务器挂掉后,强制定向到其他健康的服务器 |
bind:指定HAProxy的监听地址,可以是IPV4或IPV6,可以同时监听多个IP或端口,可同时用于listen字段中
bind [
mode http/tcp #指定负载协议类型
use_backend backend_name #调用的后端服务器组名称
示例:
1 | frontend WEB_PORT |
- check #对指定real进行健康状态检查,默认不开启
addr IP #可指定的健康状态监测IP
port num #指定的健康状态监测端口
inter num #健康状态检查间隔时间,默认2000 ms
fall num #后端服务器失效检查次数,默认为3
rise num #后端服务器从下线恢复检查次数,默认为2
weight #默认为1,最大值为256,0表示不参与负载均衡
backup #将后端服务器标记为备份状态
disabled #将后端服务器标记为不可用状态
redir http://www.magedu.com/ #将请求临时重定向至其它URL,只适用于http模式
maxconn:当前后端server的最大并发连接数
backlog:当server的连接数达到上限后的后援队列长度
也可以直接使用listen定义一组负载均衡:
1 | [root@master ~]# tail /etc/haproxy/haproxy.cfg |
HAProxy算法
无状态和有状态:
- 无状态的请求实质两次请求之间没有关联,有状态反之。
balance: 指明对后端服务器的调度算法,配置在listen或backend
静态算法
静态算法:按照事先定义好的规则轮询公平调度,不关心后端服务器的当前负载、链接数和相应速度等,且无法实时修改权重,只能重启后生效
static-rr:基于权重的轮询调度,不支持权重的运行时调整及后端服务器慢启动,其后端主机数量没有限制
first:根据服务器在列表中的位置,自上而下进行调度,但是其只会当第一台服务器的连接数达到上限,新请求才会分配给下一台服务,因此会忽略服务器的权重设置。
动态算法
动态算法:基于后端服务器 状态进行调度适当调整,比如优先调度至当前负载较低的服务器,且权重可以在haproxy运行时动态调整无需重启。
roundrobin:基于权重的轮询动态调度算法,支持权重的运行时调整,不等于lvs 的rr,支持慢启动即新加的服务器会逐渐增加转发数,每个后端backend中最多支持4095个server,此为默认调度算法,server 权重设置 weight
leastconn: 加权的最少连接的动态,支持权重的运行时调整和慢启动,即当前后端服务器连接最少的优先调度,比较适合长连接的场景使用,比如MySQL等场景。
source:源地址hash,基于用户源地址hash并将请求转发到后端服务器,默认为静态即取模方式,但是可以通过hash-type支持的选项更改,后续同一个源地址请求将被转发至同一个后端web服务器,比较适用于session保持等场景。
map-based:取模法,基于服务器权重的hash数组取模,该hash是静态的即不支持在线调整权重,不支持慢启动,其对后端服务器调度均衡,缺点是当服务器的总权重发生变化时,即有服务器上线或下线,都会因权重发生变化而导致调度结果整体改变。
consistent:一致性哈希,该hash是动态的,支持在线调整权重,支持慢启动,优点在于当服务器的总权重发生变化时,对调度结果影响是局部的,不会引起大的变动,该算法很容易导致后端服务器负载不均衡,但是比较适合session保持。
source算法示例:
1 | listen web_prot_http_nodes |
- uri:基于对用户请求的uri做hash并将请求转发到后端指定服务器
map-based:取模法
consistent:一致性哈希
uri: uniform resource identifier,统一资源标识符,是一个用于标识某一互联网资源名称的字符串
uri调度算法示例:
1 | listen web_prot_http_nodes |
- url_param:对用户请求的url中的
部分中的参数name作hash计算,并由服务器总权重相除以后派发至某挑出的服务器;通常用于追踪用户,以确保来自同一个用户的请求始终发往同一个Backend Server
url_param调度算法示例:
1 | listen web_prot_http_nodes |
- hdr(
):针对用户每个http头部(header)请求中的指定信息做hash,此处由 指定的http首部将会被取出并做hash计算,然后由服务器总权重相除以后派发至某挑出的服务器,假如无有效的值,则会被轮询调度 hdr( Cookie、 User-Agent、host )
1 | listen web_prot_http_nodes |
- rdp-cookie对远程桌面的负载,使用cookie保持会话
rdp-cookie()
示例
1 | listen RDP |
基于iptables实现目标地址转换
1 | ~]# iptables -t nat -A PREROUTING -d 192.168.34.101 -p tcp --dport 3389 -j DNAT --to-destnation 192.167.34.101:80 |
算法总结:
roundrobin——–>tcp/http 动态
leastconn———–>tcp/http 动态
static-rr————–>tcp/http 静态
first——————–>tcp/http 静态
source—————->tcp/http
Uri———————->http
url_param———->http 取决于hash_type是否consistent
hdr———————>http
rdp-cookie———>tcp
HAProxy-服务器动态上下线
1 | [root@master ~]# yum -y install socat |
IP地址透传与基于cookie实现会话保持
四层负载和七层的区别:
四层
在四层负载设备中,把client发送的报文目标地址(原来是负载均衡设备的IP地址),根据均衡设备设置的选择web服务器的规则选择对应的web服务器IP地址,这样client就可以直接跟此服务器建立TCP连接并发送数据。
七层
七层负载均衡服务器起了一个代理服务器的作用,服务器建立一次TCP连接要三次握手,而client要访问webserver要先于七层设备进行三次握手后建立TCP连接,把要访问的报文信息发送给七层负载均衡,然后七层负载均衡再根据设置的均衡规则选择特定的webserver,然后通过三次握手与此台webserver建立TCP连接,然后webserver把需要的数据发送给七层负载均衡设备,负载均衡设备再把数据发给client;所以,七层负载均衡设备起到了代理服务器的作用。
抓包命令:
- tcpdump tcp -i eth0 -nn port !22 -w dump-tcp.pcap -v
内核参数优化:
- /etc/sysctl.conf
- /etc/security.conf
七层ip透传
haproxy设置
1 | listen web_prot_http_nodes |
后端server配置
nginx
1 | http { |
httpd
1 | LogFormat "\"%{X-Forwarded-For}i\" %l %u %t \"%r\" %>s %b" common1 |
四层ip透传
配置haproxy
1 | listen web_prot_http_nodes |
配置后端服务器(nginx)
1 | listen 80 proxy_protocol; |
基于cookie实现会话保持
cookie
cookie
rewrite:重写
insert:插入
prefix:前缀
nocache:当client和hapoxy之间有缓存时,不缓存cookie
配置示例:
1 | listen web_prot_http_nodes |
测试
1 | [root@node03 ~]# curl --cookie "SERVER-COOKIE=web1" 192.168.34.100 |
状态页、日志配置和报文操作
haproxy状态页的使用
stats enable #基于默认的参数启用stats page
stats hide-version # 隐藏版本
stats refresh <delay> # 设定自动刷新时间间隔
stats uri <prefix> #自定义stats page uri,默认值:/haproxy?stats
stats realm <realm> #账户认证时的提示信息,示例:stats realm : HAProxy\ Statistics
stats auth <user>:<passwd> #认证时的账号和密码,可使用多次,默认:no authentication
stats admin { if | unless } <cond> #启用stats page中的管理功能
配置
1 | listen stats |
在浏览器访问,就可以管理haproxy
修改报文首部
在请求报文尾部添加指定首部
reqadd
在响应报文尾部添加指定首部
rspadd
示例:rspadd X-Via:\ HAPorxy
从请求报文中删除匹配正则表达式的首部
reqdel
reqidel
从响应报文中删除匹配正则表达式的首部
rspdel
rspidel
示例: rspidel server.* #从相应报文删除server信息
rspidel X-Powered-By:.* #从响应报文删除X-Powered-By信息
HAProxy日志配置
在default配置项定义:
log 127.0.0.1 local{1-7} info #基于syslog记录日志到指定设备,级别有(err、warning、info、debug)
配置rsyslog:
$ModLoad imudp
$UDPServerRun 514
local3.* /var/log/haproxy.log
配置HAProxy:
listen web_port
bind 127.0.0.1:80
mode http
log global
option tcplog
server web1 127.0.0.1:8080 check inter 3000 fall 2 rise 5
重启syslog服务并访问haproxy状态页
自定义日志记录
将特定信息记录在日志中
capture cookie <name> len <length> #捕获请求和响应报文中的 cookie并记录日志
capture request header <name> len <length> #捕获请求报文中指定的首部内容和长度并记录日志
capture response header <name> len <length> #捕获响应报文中指定的内容和长度首部并记录日志
示例
1 | capture request header Host len 256 |
压缩功能
compression algo #启用http协议中的压缩机制,常用算法有gzip deflate
compression type #要压缩的类型
示例
compression algo gzip
compression type compression type text/plain text/html text/css text/xml text/javascript application/javascript
web服务器状态监测
option httpchk
option httpchk
option httpchk
option httpchk
示例
1 | listen web_prot_http_nodes |
ACL
ACL必须在haproxy工作在http模式下才可以使用。
- acl:对接收到的报文进行匹配和过滤,基于请求报文头部中的源地址、源端口、目标地址、目标端口、请求方法、URL、文件后缀等信息内容进行匹配并执行进一步操作。
1 | acl <aclname> <criterion> [flags] [operator] [<value>] |
- acl 名称 条件 条件标记位 具体操作符 操作对象类型
1 | acl image_service hdr_dom(host) -i img.magedu.com |
- ACL名称,可以使用大字母A-Z、小写字母a-z、数字0-9、冒号:、点.、中横线和下划线,并且严格区分大小写,必须Image_site和image_site完全是两个acl。
Criterion-acl
<\criterion> :匹配条件
dst 目标IP
dst_port 目标PORT
src 源IP
src_port 源PORT
hdr <\string>用于测试请求头部首部指定内容
hdr_dom(host) 请求的host名称,如 www.magedu.com
hdr_beg(host) 请求的host开头,如 www. img. video. download. ftp.
hdr_end(host) 请求的host结尾,如 .com .net .cn
path_beg 请求的URL开头,如/static、/images、/img、/css
path_end 请求的URL中资源的结尾,如 .gif .png .css .js .jpg .jpeg
flags
<\flags>-条件标记
-i 不区分大小写
-m 使用指定的pattern匹配方法
-n 不做DNS解析
-u 禁止acl重名,否则多个同名ACL匹配或关系
– 强制flag结束. 当字符串和某个flag相似时使用
operator
[operator]-操作符:
整数比较:eq、ge、gt、le、lt
字符比较:
- exact match (-m str) :字符串必须完全匹配模式
- substring match (-m sub) :在提取的字符串中查找模式,如果其中任何一个被发现,ACL将匹配
- prefix match (-m beg) :在提取的字符串首部中查找模式,如果其中任何一个被发现,ACL将匹配
- suffix match (-m end) :将模式与提取字符串的尾部进行比较,如果其中任何一个匹配,则ACL进行匹配
- subdir match (-m dir) :查看提取出来的用斜线分隔(“/”)的字符串,如果其中任何一个匹配,则ACL进行匹配
- domain match (-m dom) :查找提取的用点(“.”)分隔字符串,如果其中任何一个匹配,则ACL进行匹配
value
- Boolean #布尔值
- integer or integer range #整数或整数范围,比如用于匹配端口范围
- IP address / network #IP地址或IP范围
- string
exact –精确比较
substring—子串 www.magedu.com
suffix-后缀比较
prefix-前缀比较
subdir-路径, /wp-includes/js/jquery/jquery.js
domain-域名,www.magedu.com
- regular expression #正则表达式
- hex block #16进制
ACL定义与调用
acl作为条件时的逻辑关系:
- 与:隐式(默认)使用
- 或:使用“or” 或 “||”表示
- 否定:使用“!“ 表示
示例:
if invalid_src invalid_port 与关系
if invalid_src || invalid_port 或
if ! invalid_src 非
acl 示例-域名匹配
1 | listen web_port |
acl 示例-源地址子网匹配
1 | listen web_port |
acl 示例-源地址访问控制
1 | listen web_port |
acl示例-匹配浏览器
1 | listen web_port |
自定义错误页面
1 | errorfile 500 /usr/local/haproxy/html/500.html #自定义错误页面跳转 |
基于acl+文件后缀实现动静分离
1 | listen web_port |
acl-匹配访问路径
1 | listen web_port |
http模式下基于策略的访问控制
1 | listen web_port |
预定义acl
1 | ACL name Equivalent to Usage |
预定义acl的使用
1 | listen web_port |
四层访问控制
tcp-request connection {accept|reject} [{if | unless}
示例
1 | listen redis-port |
HAProxy-https协议
配置HAProxy支持https协议:
支持ssl会话;
bind *:443 ssl crt /PATH/TO/SOME_PEM_FILE
crt 后证书文件为PEM格式,且同时包含证书和所有私钥
cat demo.crt demo.key > demo.pem
把80端口的请求重向定443
bind *:80
redirect scheme https if !{ ssl_fc }
向后端传递用户请求的协议和端口(frontend或backend)
http_request set-header X-Forwarded-Port %[dst_port]
http_request add-header X-Forwared-Proto https if { ssl_fc }
https证书制作
1 | ~]# mkdir /usr/local/haproxy/certs |
配置haproxy支持https
1 | frontend https |
HAProxy服务器动态上下线
1 | ~]# echo "show info" | socat stdio /var/lib/haproxy/haproxy.sock |