第三方服务挂了,如何保证服务不受影响?
沈老师,我们有很多服务依赖第三方接口,他们的接口不稳定,从而影响我们的服务,有没有什么方法避免?
今天和大家聊一聊这个问题。
(2)当第三方的接口变动时,只有服务需要修改,而不是所有调用方均修改;内部服务可能对上游业务提供了很多服务接口,当有一个接口跨公网第三方调用超时时,可能导致所有接口都不可用,即使大部分接口不依赖于跨公网第三方调用。为什么会出现“一个第三方接口超时,所有接口都不可用”的情况呢?内部服务对业务方提供的N个接口,会共用服务容器内的工作线程(假设有100个工作线程)。假设这N个接口的某个接口跨公网依赖于第三方的接口,发生了网络抖动,或者接口超时(不妨设超时时间为5秒)。潜台词是,这个工作线程会被占用5秒钟,然后超时返回业务调用方。假设这个请求的吞吐量为20qps,言下之意,很短的时间内,所有的100个工作线程都会被卡在这个第三方超时等待上,而其他N-1个原本没有问题的接口,也得不到工作线程处理。(3)垂直拆分,N个接口拆分成若干个服务,使得在出问题时,被牵连的接口尽可能少(依旧不根本解决问题,难道一个服务只提供一个接口吗?);业务场景:通过OpenID实时获取微信用户基本信息。解决方案:增加一个代理,向服务屏蔽究竟是“本地实时”还是“异步远程”去获取返回结果。(2)内部service调用异步代理service;(3)异步代理service通过OpenID在本地拿取数据;(4)异步代理service将数据返回内部service;(6)异步代理service定期跨公网调用微信服务;优点:公网抖动,第三方接口超时,不影响内部接口调用。缺点:本地返回的不是新数据(很多业务可以接受数据延时)。画外音:有时候,内部service和异步代理service可以合成一个service。
(3)超时后,调用第二个备份服务,未来都直接调用备份服务,直到超时的服务恢复;优点:公网抖动,第三方接口超时,不影响内部接口调用(初期少数几个请求会超时)。缺点:不是所有公网调用都能够像短息网关,电子合同服务一样有备份接口的,像微信、支付宝等就只此一家。业务场景:本地结果,同步第三方服务,例如用户在58到家平台下单,58到家平台需要通知平台商家为用户提供服务。解决方案:本地调用成功就返回成功,异步调用第三方接口同步数据(和异步代理有微小差别)。(3)内部service返回结果给业务调用方成功;(4)异步service定期将本地数据取出(或者通知也行,实时性好);优点:公网抖动,第三方接口超时,不影响内部接口调用。任何脱离业务的架构方案都是耍流氓,可以结合业务实施方案:(1)业务能接受旧数据:读取本地数据,异步代理定期更新数据;(3)向第三方同步数据:本地写成功就算成功,异步向第三方同步数据;