node.js使用cluster实现多进程_node.js

2020-11-27 来源：好走旅游网

nodeJS的master 开始并不是上帝，他只是一个小小的太监，每次请求(妃子)来的时候，他只会默默的看着几个worker小皇帝相互争夺，如果某个worker胜出，则其他的worker也就草草了事，等下一个请求过来。所以说，每来一次请求，都会引起一场腥风血雨。而，我们体会最深的就是惊群现象,即,CPU爆表.

借用TJ大神的一幅图，说明一下。

这里，master只是绑定端口，而不会对来的请求做任何处理。通过将socket的fd给fork出来的进程。造成的结果就是4个人男人(worker)抢一个妃子(request). 那场面别提有多血腥了。

前面说过，cluster其实就是对child_process的一层封装，那我们继续往底层走一点。实现cluster多进程。首先，我们需要了解，这几个模块的基本用法。net,child_process.

child_process

这个应该是nodeJS 进程最核心的模块。基本的方法，有几个，不过我这里，只介绍比较核心的:spawn ,fork ,exec。如果大家有兴趣，可以去child_process参考.

child_process.spawn(command, args)

该方法用来运行指定的程序。比如: node app.js.他是异步的命令，但不支持callback, 不过我们可以使用process.on来监听结果。他自带3个参数.

command: 执行命令
args[Array]: 命令所带的参数
options[Object]: 环境变量对象

OK~ 我们举个一个简单的demo: 试一试运行 touch apawn.js

如果，正确的话，应该会输
出child process exited with code 0. 然后运行目录会生成pawn.js文件。当然，如果你需要运行多参数的命令的话这就有点蛋疼了。
所以，nodeJS 使用了exec对其进行很好的封装，而且他支持回调函数，这比较能够让我们理解。

child_process.exec(order,cb(err[,stdout,stderr]));

order: 就是你执行的命令. 比如: rm spawn.js
cb: 就是命令执行成功后的回调函数。

正常情况下会删除spawn.js文件。

上面两个只是简单的运行进程的命令。最后，(Boss总是最后出场的). 我们来瞧瞧fork方法的使用.
fork其实也是用来执行进程，比如,spawn("node",['app.js']),其实和fork('app.js') 是一样的效果的。但是，fork牛逼的地方在于他在开启一个子进程时，同时建立了一个信息通道(双工的哦). 俩个进程之间使用process.on("message",fn)和process.send(...)进行信息的交流.

child_process.fork(order) //创建子进程

worker.on('message',cb) //监听message事件

worker.send(mes) //发送信息

他和spawn类似都是通过返回的通道进行通信。举一个demo, 两个文件master.js和worker.js 来看一下.

运行，node app.js, 会输出一下结果:

现在我们已经学会了，如何使用child_process来创建一个基本的进程了。
关于net 这一模块，大家可以参考一下net模块.

ok . 现在我们正式进入，模拟nodeJS cluster模块通信的procedure了。

out of date 的cluster

这里先介绍一下，曾经的cluster实现的一套机理。同样，再放一次图

我们使用net和child_process来模仿一下。

ok~ 我们运行一下程序, 首先运行node master.js.
然后使用测试工具,siege.
siege -c 100 -r 2 http://localhost:3000
OK，我们看一下，到底此时的负载是否均衡。

worker[1182]:52
worker[1183]:42
worker[1184]:90
worker[1181]:16

发现，这样任由worker去争夺请求，效率真的很低呀。每一次，触发请求，都有可能导致惊群事件的发生啊喂。所以，后来cluster改变了一种模式，使用master来控制请求的分配，官方给出的算法其实就是round-robin 轮转方法。

高富帅版cluster

现在具体的实现模型就变成这个.

由master来控制请求的给予。通过监听端口，创建一个socket，将获得的请求传递给子进程。

从tj大神那里借鉴的代码demo:

这里就经由master来掌控全局了. 当一个皇帝(worker)正在宠幸妃子的时候，master就会安排剩下的几个皇帝排队一个几个的来。其实中间的handle就会我们具体的业务逻辑. 如同:app.js.
ok~ 我们再来看一下cluster模块实现多进程的具体写法.

cluster模块实现多进程

现在的cluster已经可以说完全做到的负载均衡。在cluster说明我已经做了阐述了。我们来看一下具体的实现吧

这里使用的是HTTP模块，当然，完全也可以替换为socket模块. 不过由于这样书写，将集群和单边给混淆了。所以，推荐写法是将具体业务逻辑独立出来.

接着我们开启服务，node master.js
然后进行测试

siege -c 100 -r 2 http://localhost:8124

我这里开启的是长连接. 每个worker处理的长连接数是有限的。所以，当有额外的连接到来时，worker会断开当前没有响应的连接，去处理新的连接。
不过，平常我们都是使用HTTP开启短连接，快速处理大并发的请求。
这是我改成HTTP短连接之后的结果

Transactions: 200 hits
Availability: 100.00 %
Elapsed time: 2.09 secs
Data transferred: 0.00 MB
Response time: 0.02 secs
Transaction rate: 95.69 trans/sec
Throughput: 0.00 MB/sec
Concurrency: 1.74
Successful transactions: 200
Failed transactions: 0
Longest transaction: 0.05
Shortest transaction: 0.02

那，怎么模拟大并发嘞？
e e e e e e e e e ...
自己解决啊~

开玩笑的啦~ 不然我写blog是为了什么呢？就是为了传播知识.
在介绍工具之前，我想先说几个关于性能的基本概念
QPS(TPS),并发数,响应时间,吞吐量,吞吐率

你母鸡的性能测试theories

自从我们和服务器扯上关系后,我们前端的性能测试真的很多。但这也是我们必须掌握的tip. 本来前端宝宝只需要看看控制台，了解一下网页运行是否运行顺畅, 看看TimeLine，Profile 就可以了。不过，作为一名有追求，有志于改变世界的童鞋来说。。
md~ 又要学了...

ok~ 好了，在进入正题之前，我再放一次线上的测试结果.

Transactions: 200 hits
Availability: 100.00 %
Elapsed time: 13.46 secs
Data transferred: 0.15 MB
Response time: 3.64 secs
Transaction rate: 14.86 trans/sec
Throughput: 0.01 MB/sec
Concurrency: 54.15
Successful transactions: 200
Failed transactions: 0
Longest transaction: 11.27
Shortest transaction: 0.01

根据上面的数据，就可以得出，你网页的大致性能了。
恩~ let's begin

吞吐率

关于吞吐率有多种解读，一种是:描绘web服务器单位时间处理请求的能力。根据这个描述,其单位就为: req/sec. 另一种是: 单位时间内网络上传输的数据量。而根据这个描述的话,他的单位就为: MB/sec.
而这个指标就是上面数据中的Throughput. 当然，肯定是越大越好了

吞吐量

这个和上面的吞吐率很有点关系的。吞吐量是在没有时间的限制下，你一次测试的传输数据总和。所以，没有时间条件的测试，都是耍流氓。
这个对应于上面数据中的Data transferred.

事务 && TPS

熟悉数据库操作的童鞋，应该知道，在数据库中常常会提到一个叫做事务的概念。在数据库中，一个事务，常常代表着一个具体的处理流程和结果. 比如，我现在想要的数据是 2013-2015年，数学期末考试成绩排名. 这个就是一个具体的事务，那么我们映射到数据库中就是，取出2013-2015年的排名，然后取平均值，返回最后的排序结果。可以看出，事务并不单单指单一的操作，他是由一个或一个以上操作组合而成具有实际意义的。那，反映到前端测试，我们应该怎样去定义呢？首先，我们需要了解，前端的网络交流其实就是请求-响应模式. 也就是说，每一次请求，我们都可以理解为一次事务(trans).
所以，TPS(transaction per second)就可以理解为1sec内，系统能够处理的请求数目.他的单位也就是: trans/sec . 你当然也可以理解为seq/sec.
所以说，TPS 应该是衡量一个系统承载力最优的一个标识.
TPS的计算公式很容易的出来就是: Transactions / Elapsed time.
不过, 凡事无绝对。大家以后遇到测试的时候，应该就会知道的.

并发数

就是服务器能够并发处理的连接数，具体我也母鸡他的单位是什么。官方给出的解释是:

Concurrency is average number of simultaneous connections, a number which rises as server performance decreases.

这里我们就理解为，这就是一个衡量系统的承载力的一个标准吧。当Concurrency 越高，表示系统承载的越多，但性能也越低。

ok~ 但是我们如何利用这些数据，来确定我们的并发策略呢？ e e e e e e e ...
当然，一两次测试的结果真的没有什么卵用. 所以实际上，我们需要进行多次测试，然后画图才行。当然，一些大公司，早就有一套完整的系统来计算你web服务器的瓶颈,以及给出最优的并发策略.
废话不多说，我们来看看，如何分析，才能得出比较好的并发策略。

探究并发策略

首先，我们这里的并发需要进行区分. 一个是并发的请求数，一个是并发的用户数. 这两个对于服务器是完全不同的需求。
假如100个用户同时向服务器分别进行10次请求，与1个用户向服务器连续进行1000次请求。两个的效果一样么？

一个用户向服务器连续进行1000次请求的过程中，任何时刻服务器的网卡接受缓存区中只有来自该用户的1个请求，而100个用户同时向服务器分别进行10次请求的过程中，服务器网卡接收缓冲区中最多有100个等待处理的请求，显然这时候服务器的压力更大。

所以上面所说的并发用户数和吞吐率是完全不一样的.
不过通常来说，我们更看重的是Concurrency(并发用户数). 因为这样更能反映出系统的能力。一般，我们都会对并发用户数进行一些限制，比如apache的maxClients参数.
ok~ 我们来实例分析一下吧.

首先，我们拿到一份测试数据.

接着，我们进行数据分析.

根据并发数和吞吐率的关系得出下列的图.

OK~ 我们会发现从大约130并发数的地方开始，吞吐率开始下降，而且越多下降的越厉害。主要是因为，在前面部分随着用户数的上升，空闲的系统资源得到充分的利用，当然就和正太曲线一样，总会有个顶点。当到达一定值后，顶点就会出现了. 这就我们的系统的一个瓶颈.

接着，我们细化分析，响应时间和并发用户数的相关性

同样额道理，当并发数到达130左右，正对每个req的响应时间开始增加，越大越抖，这适合吞吐率是相关的。所以，我们可以得出一个结论，该次连接并发数最好设置为100~150之间。当然，这样的分析很肤浅，不过，对于我们这些前端宝宝来说了解一下就足够了。

接下来,我们使用工具来武装自己的头脑.
这里主要介绍一个测试工具，siege.

并发测试工具

事实上并发测试工具主要有3个siege,ab,还有webbench. 我这里之所以没介绍webbench的原因，因为，我在尝试安装他时，老子，电脑差点就挂了(我的MAC pro)... 不过后面，被聪明的我巧妙的挽回~ 所以，如果有其他大神在MAC x11 上成功安装，可以私信小弟。让我学习学习。
ok~ 吐槽完了。我们正式说一下siege吧

siege

安装siege利用MAC神器 homebrew, 就是就和js前端世界的npm一样.
安装ing:

brew install siege

安装成功--bingo
接着，我们来看一下语法吧.

-c NUM 设置并发的用户数量.eg: -c 100;

-r NUM 设置发送几轮的请求，即，总的请求数为: -cNum*-rNum但是, -r不能和-t一起使用(为什么呢？你猜).eg: -r 20

-t NUM 测试持续时间，指你运行一次测试需要的时间，在timeout后，结束测试.

-f file. 用来测试file里面的url路径 eg: -f girls.txt.

-b . 就是询问开不开启基准测试(benchmark)。这个参数不太重要，有兴趣的同学，可以下去学习一下。

关于-c -r我就不介绍了。大家有兴趣，可以参考一下，我前一篇文章让你升级的网络知识. 这里主要介绍一下 -f 参数.
通常，如果我们想要测试多个页面的话，可以新建一个文件，在文件中创建你想测试的所有网页地址.
比如:
//文件名为 urls.txt

www.example.com
www.example.org
123.45.67.89

然后运行测试

siege -f your/file/path.txt -c 100 -t 10s

OK~ 关于进程和测试的内容就介绍到这了。

显示全文

全部栏目

node.js使用cluster实现多进程_node.js