MongoDB 集群请求连接被拒绝的分析
某运营商搭建了一套 MongoDB 集群,承载了大大小小的几十个非计费类应用,1亿左右的用户量,随着访问量的增加,业务繁忙时期偶尔出现连接拒绝的错误。
为了搞清楚原因,先从mongo访问数据库的模式说起,如下图:
我们发现客户端的请求是通过驱动连接到mongos或mongod的。
如果有多个实例化的MongoClient,那么就会有多个对应的连接池。
通过调试看到MongoClient的连接池大小默认值为100。可以在代码里面通过MaxConnectionPoolSize属性来修改默认值。
但mongod或mongos能支持的大并发访问连接数还与服务端实例上的maxConn这个参数有关。
连上实例后通过命令:db.serverStatus().connections可以查看这个参数值,如下图所示输出:
Current表示当前到实例上正在运行的连接数。
Available表示当前实例还可以支持的并发连接数。
TotalCreated表示当前实例从启动到现在一共创建的连接数,包括历史已经关闭了的。
也就是说此mongod或mongos大能支持的并发连接数为:Current+available=819.
那这个819是怎么来的?
它其实是由maxIncomingConnections (4.0版本里面参数名改为maxConn)和操作系统单个进程能打开的大文件描述符数总量的80%决定的,取两个之间的小值。
可以通过如下命令查看操作系统的限制,如下图:
可以看到单个进程能打开的大文件描述符数为1024,1024*80% = 819.2 取整数819.
而maxConn参数的默认值65536.
所以大可以支持的并发连接数为819,刚好等于前面的current+available.
为了模拟出生产环境的错误,首先将参数maxConn设置为10,也就是让服务器mongod或mongos大支持10个并发,配置文件修改如下:
通过命令检查大并发连接确实变为10,如下:
下面写一段代码测试,目的是模拟多线程请求,并发线程为29个,驱动连接池设为20,MongoClient设为“单例”模式,如下:
执行后看日志出现如下错误:
可以看到当并发的连接到达10个后,第11个连接被拒绝了。因为服务端此时设置的maxConn就为10.
下面再次修改服务器上的maxConn参数为100,其它参数不变,测试第二个场景。
程序和上面一样,执行后的日志输出如下,可以看到通过修改服务端的连接数参数maxConn,客户端的20个并发线程都可以成功连接到mongod实例。
在运行过程中也可以监控到,一共21个连接,与预想的一样。
后测试一个场景:将连接池大小设为5,其它参数不变,并发线程还是为20,服务端maxConn还是100.
运行上面代码,执行输出日志如下:
同时监控服务端连接数:
可以看到只打开了6个连接,说明受连接池大小的约束。
mongod或mongos支持的大并发连接数受操作系统ulimit(可通过/etc/security/limits.conf文件来配置)和服务端maxConn参数限制,取其中较小值,这两个参数均可调整。
如果客户端连接数超过mongod或mongos大并发数, 会导致超过的连接请求被refused。
每个mongoClient会维护一个连接池,客户端的请求会通过连接池连接到mongod或mongos, 如果并发客户端请求数超过了连接池MaxConnectionPoolSize大小, 服务端mongod或mongos多只打开MaxConnectionPoolSize个连接。其中某些连接会为多个客户端请求服务。
1
作 者
郭远威,大数据顾问,MongoDB中文社区联席主席。数据库专家,曾负责迁移英国大虚拟运营商; 负责实施了Afrimax集团在非洲多国的BI大数据系统,现负责策划电信领域大数据解决方案。著有《大数据存储MongoDB实战指南》一书。
往期回顾
热门活动:
福利 | 分享你和MongoDB的故事,获免费海外参会机会
技术文章:
完美数据迁移-MongoDB Stream的应用
MongoDB 新功能介绍-Change Streams
MongoDB 4.0 系列之 —事务实现解析(一)
MongoDB 4.0 系列之 —事务实现解析(二)
使用mlaunch和m快速搭建MongoDB测试集群
精彩译文:
为什么MongoDB适合深度学习?
MongoDB Compass聚合管道构建器新特性介绍
相关文章