关于2021年2月10日交易服务故障的说明

发布于 2021年2月20日

1. 故障说明:
欧易OKX站的交易服务在2021年2月10日13:37:00 HKT~15:36:00 HKT期间出现间歇性的网站访问异常和交易异常的故障。
经调查:由于当天下午访问网站流量过大,导致鉴权服务宕机,内部服务之间调用超时,WEB、APP、API端服务器间歇性异常。
发生过程应对摘要:
截至2021-02-10 13:37:00 HKT,我们的检测系统发现系统出现异常。
截至2021-02-10 13:37:00 HKT,WEB和APP上无行情和深度数据展示,间歇性返回错误消息"server error";API用户间歇性收到错误消息"invalid authority";间歇性无法使用交易功能。
截至2021-02-10 13:40:00 HKT,经过相关开发人员紧急排查,找到系统异常点,短时间内流量过大,导致鉴权服务宕机,内部服务之间调用超时,立即启动事件响应程序,紧急进行修复。
截至2021-02-10 15:36:00 HKT,恢复WEB和APP和API行情数据展示和交易功能。

2. 我们通过做哪些工作保证欧易OKX平台的稳定性?
欧易OKX提供7*24全天候的交易服务,我们致力于为所有用户提供一个稳定、不间断的交易服务平台。但是由于高性能交易系统非常复杂,各种异常情况非常多,与所有交易系统一样,我们无法保证系统100%稳定运行。但是我们一直在从各个方面努力,提升系统稳定性,最大程度的减少停机出现的概率,包括:

1). 加强工程质量保证,优化测试体系;新功能代码在模拟盘稳定运行一段时间后才能上线
2). 架构升级,正在实现多机和多地域高可用,减少硬件、软件造成的宕机时间
3). 实现热更新,无状态逻辑实现热更新,减少升级对用户交易的影响

3. 如何获取系统更新?

1).在发生故障之后,我们会在Status页面发布故障说明。
2).当有新的系统升级事件时,我们会在Status页面发布通知;并通过市场和社群的渠道(API用户社群+普通用户社群)及时通知广大用户;同时API用户可以通过订阅system/status频道来实时获取通知。