• 1
  • 2
  • 3
  • 4

首页 / 行业

西安“一码通”再崩溃!真的只是网络拥堵造成的吗?

2022-01-06 09:42:00

1月4日,西安“一码通”又发生故障了,直到当天下午才逐渐恢复正常,根据陕西发布的消息,一码通首页显示正常,但点击不能顺利进入。有市民接到通知:全市核酸检测应急平台因当前流量过大,网络目前繁忙无法登陆,正在抢修。


这不是西安“一码通”第一次发生故障,2021年12月20日,西安“一码通”就曾因访问量过大导致系统崩溃,无法扫码,导致许多西安市民,难以进行核酸检测。

“一码通”宕机对市民日常生活影响有多大?西安市民出行、上班、出入小区都需要出示“一码通”,同时持48小时核酸检测。一码通故障,使得西安交通出现拥堵,核酸检测也需要耗时更长,这不仅影响市民正常生活,还可能增加交叉感染的风险。

西安需要尽快解决“一码通”接二连三崩溃的问题,而这就需要找到“一码通”崩溃的真实原因是什么?

真的只是网络拥堵导致崩溃吗

根据官方的说法,是因为网络拥堵。上一次系统崩溃的时候,即2021年12月20日,在西安疫情防控记者会上,彼时西安市大数据局局长刘军表示,12月20日早7时40分左右,西安“一码通”用户访问量激增,每秒访问量达到以往峰值的10倍以上,造成网络拥塞,致使包括“一码通”在内的部分应用系统无法正常使用。

“对于‘一码通’平台中断对市民造成的不便,我们深表歉意,我们将持续加强对平台的监控,‘一码通’平台技术团队将24小时不间断驻场运维,加强网络及系统资源保障,确保‘一码通’平台良好运行。”刘军说,在全员核酸检测的特殊时期,为减轻系统压力,建议广大市民非必要不展码、亮码,在出现系统卡顿时,请耐心等待,尽量避免反复刷新。

因为西安“一码通”多次崩溃,1月5日凌晨,西安市大数据资源管理局党组书记、局长刘军因履职不力,停职检查。

那么如何解决网络拥堵带来的系统崩溃呢,最直接的办法是,限流和扩容。在2021年12月30日,工信部总工程师韩夏曾到西安调研,他就强调,要持续做好大数据和信息化支撑,西安“一码通”要加强技术改进和网络扩容,确保平台安全稳定运行。

然而真的是网络拥堵造成系统崩溃,此前武汉疫情的时候,为什么没有宕机的情况,武汉的长住人口,比西安更多哦,资料显示,2021年西安市常住人口数为1295.29万人,武汉市常住人口达到1351.5万。

有熟知网络系统的人士认为,网络拥堵可能只是表象原因。据他分析,西安“一码通”已经上线很长时间,大多数时候是稳定的,西安的上班高峰期,也就是说扫码高峰期,大概是在8点到9点之间,而几次崩溃却都发生在7点多,这个时候,网络应该是不拥堵的。

而且即使真是网络拥堵导致系统崩溃,其实很容易解决,就如上文说的,限流、扩容,这个操作并不难,而且耗时不长。比如说限流,只需要把一部分网络请求阻拦住,让另外部分网络请求通过就可以,扩容就是增加服务器的硬件,比如内存、CPU,或者如果服务器有集群,可以增加更多服务器。

如今计算机系统,基本都是部署在云上,西安“一码通”听说是部署在阿里云上,在云计算平台上限流、扩容,可能并不需要花费大半天时间,而西安“一码通”上一次崩溃,到恢复耗费了一整天时间,这次也花费大半天。

另外还有一个很奇怪的现象,就是在12月20日当天,“一码通”的样式回滚到了几个月前,据描述,从10月底开始,“一码通”二维码就有了边框注明疫苗接种的状态,而在12月20日上午这个样式里是有边框的,到下午系统恢复之后,却没有边框,显示的是几个月前的样式,据该人士分析,如果是流量太大,直接优化网络和硬件就可以,程序怎么会回滚到几个月前,真正的原因可能是,程序出了问题,一时改不好,所以直接找到以前的版本运行。

再次崩溃的真实原因是什么

另一位技术工作人员就“一码通”再次崩溃原因也进行了分析,他认为,是因为高并发下缓存被击穿,且未用时序数据库,要解决这个问题,只有几天时间是来不及的。

该工作人员表示,集群扩容、性能调优,这些快速见效的方法肯定都已经做了,还是会瞬间宕机,而最深层的原因是,“一码通”平台自身系统设计的问题,系统性能不够,短时间很难解决,现在只能是做好限流熔断,避免全面崩溃。

针对“一码通”崩溃的问题,有10余位来自腾讯、华为、中兴等企业人士,从前端、后端、测试等多个方面进行过分析,也谈到系统设计的不足。

比如说,市民因为长时间无法刷出健康吗,多次退出刷新,导致更多新流量送达服务器,给服务器带来压力,这其实也说明西安“一码通”的系统在限流措施上没有做好。

再比如,“一码通”平台在设计的时候,可能并没有考虑到高流量、高负载的情况,产品设计未考虑千万级的并发访问,而且交付前未进行同等级的压力测试。

为什么会出现这些情况,或许与项目实施过程中的一些不妥举措有关。据了解,现在正在运行的“一码通”,是由市大数据资源管理局牵头,中国电信西安分公司开发部署,作为总承包方,中国电信将该项目全部外包招标,而采购来源单一。

这里列出部分采购信息:
“一码通”系统建设单一来源:西安东软
“一码通”安全配套单一来源:杭州安恒
可视化工程单一来源:中译语通
200W的短信服务单一来源:阿里云

并不是说单一来源就一定会出问题,让人疑惑的是,这么大的项目,为何不可以进行多渠道采购,比如说,配套安全项目,全部采购自杭州安恒,估计这么大的项目,金额都是百万以上,因为都是标准设备,其实市面上可供选择的产品很多,为什么只选择一家。

另外还有一个很奇怪的情况,在2020年上线的时候,由西安市大数据管理局为主单位筹建的西安“一码通”系统,因为建成效果非常好,曾获得表彰。然而在2021年11月26日,以西安科技局为甲方牵头单位的西安“一码通”系统开发项目公开采购结果。

也就是说,西安已经计划不再使用由西安市大数据管理局为主筹建的“一码通”系统,而将更换为由西安科技局牵头的“一码通”,这不犹让人猜测,是不是在2021年12月20日之前,现行的西安“一码通”系统已经显现出问题,因此更换牵头方。

总结

截至1月4日,西安现有确诊病例1741例,新增确诊病例95例,几乎成为继2020年武汉以来疫情非常严重的城市。因此,保证“一码通”系统的稳定性,攻克上述提到的问题,是目前的当务之急。

然而就如上文所言,如果是系统本身架构设计的问题,短期内只能做到让系统恢复运行,未来崩溃宕机的情况可能还是会时而发生,或许当前也只能期待由西安科技局牵头的“一码通”新系统项目早日完成,而且期望它在系统设计上做到更好。

网络崩溃西安故障

  • 1
  • 2
  • 3
  • 4

最新内容

手机

相关内容

  • 1
  • 2
  • 3

猜你喜欢