• 正文
    • 問題出在哪里?
    • 誰應(yīng)該為之“背鍋”?
    • 以后如何“未雨綢繆”?
    • 結(jié)語
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

西安一碼通“連連崩”,聊聊到底誰該“背鍋”?

2022/01/07
353
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

與其糾結(jié)于“背鍋人”是誰,我們更應(yīng)該把精力放在未來應(yīng)該如何未雨綢繆,避免類似情況的發(fā)生。

所謂“好事不出門,壞事傳千里”,身為一名在京工作的陜西人民,看到自己的家鄉(xiāng)西安最近總是以各種負(fù)面姿態(tài)出現(xiàn)在熱搜榜上,心里難免不是滋味兒。

疫情的突然爆發(fā)讓所有人都猝不及防,在抗疫過程中各種問題也隨之暴露,#一碼通崩了#是目前西安遇到的諸多問題中比較典型、影響面也比較廣的一個,而且短短兩個星期內(nèi)竟然發(fā)生了兩次。

放在以前我們可能很難想象,一個數(shù)字化系統(tǒng)的故障竟然可以引起如此大規(guī)模的社會混亂。

在一碼通崩潰的當(dāng)天,大量市民無法乘坐地鐵和出租車,進(jìn)不了公司和商廈,甚至有家都不能回,一時間怨聲載道——我們同學(xué)、同鄉(xiāng)群里各種問候祖宗的“優(yōu)美陜西話”此起彼伏,讓人不禁感慨中文的“表意豐富”和“博大精深”。

這事兒也引起了領(lǐng)導(dǎo)層的高度重視,這不,據(jù)工信部官網(wǎng)4日發(fā)布,2021年12月30日至31日,工業(yè)和信息化部總工程師韓夏到陜西省通信管理局開展疫情防控工作調(diào)研。

工信部官網(wǎng)截圖

韓夏強(qiáng)調(diào),西安“一碼通”要加強(qiáng)技術(shù)改進(jìn)和網(wǎng)絡(luò)擴(kuò)容,確保平臺安全穩(wěn)定運(yùn)行。韓夏甚至還專程來到西安“一碼通”工作專班,了解核酸采樣系統(tǒng)應(yīng)急處置措施,要求系統(tǒng)再優(yōu)化,細(xì)節(jié)再完善,確保不出現(xiàn)擁塞宕機(jī)現(xiàn)象。

到了5日上午,“西安大數(shù)據(jù)資源管理局局長被停職”突然曝出,事件再度升級,“一碼通崩了的鍋究竟該由誰來背”的話題也引發(fā)了網(wǎng)友們的廣泛議論。

身為一名在京工作家鄉(xiāng)又在陜西的科技圈媒體人,覺得有必要趁此來聊聊這個事兒。

問題出在哪里?

首先,“西安一碼通”為什么會崩?關(guān)于問題的原因,目前可謂是眾說紛紜,筆者也咨詢了一些業(yè)內(nèi)專家,在沒有官方詳細(xì)的調(diào)查報告出來之前,大家給了以下幾種猜測:

第一種可能是網(wǎng)絡(luò)堵塞

當(dāng)“一碼通”系統(tǒng)第一次崩潰的時候,原西安市大數(shù)據(jù)資源管理局局長劉軍在出席新聞發(fā)布會時對此做出回應(yīng)稱,近日因“一碼通”使用頻率加大,對網(wǎng)絡(luò)與平臺造成較大壓力,“12月20日早7:40分左右,西安‘一碼通 ’用戶訪問量激增,每秒訪問量達(dá)到以往峰值的10倍以上,造成網(wǎng)絡(luò)擁塞,致使包括 ‘一碼通’在內(nèi)的部分應(yīng)用系統(tǒng)無法正常使用。經(jīng)緊急協(xié)調(diào)資源并采取擴(kuò)容、限流等應(yīng)急措施,平臺已逐步恢復(fù)使用,但因訪問量仍很大,尚可能有部分卡頓現(xiàn)象。”

然而,對于該回應(yīng),部分專家和網(wǎng)友并不完全買賬。網(wǎng)友分析道——西安“一碼通”其實(shí)上線已經(jīng)很長時間了,大部分時候還是很穩(wěn)定的。西安上班高峰期,也就是掃碼高峰期應(yīng)該在8點(diǎn)至9點(diǎn)之間,但“一碼通”崩潰是從7點(diǎn)多開始的,當(dāng)時大部分人都還沒出門,更談不上掃一碼通了。網(wǎng)絡(luò)應(yīng)該不可能在那個時候擁堵,更不可能因?yàn)閾矶略斐上到y(tǒng)崩潰。

某不愿意透露姓名的通信專家則向筆者直截了當(dāng)?shù)赝虏郏?ldquo;這個和網(wǎng)絡(luò)的關(guān)系應(yīng)該不大,大家用的都是4G,難道西安的4G就比其他地方的4G慢?大家平時上網(wǎng)打游戲看視頻都沒有問題,掃個碼網(wǎng)絡(luò)就承受不了了?更多的可能是和服務(wù)器、計(jì)算能力或大數(shù)據(jù)相關(guān)。”

第二種可能是系統(tǒng)不夠健壯

西安電子科技大學(xué)網(wǎng)絡(luò)與信息安全學(xué)院教授楊超則在接受媒體采訪時表示,“一碼通”此次出現(xiàn)長時間、大范圍不能掃碼的情況,可能是系統(tǒng)不夠健壯,同時掃碼人數(shù)的激增導(dǎo)致系統(tǒng)的壓力變大了,軟硬件系統(tǒng)負(fù)荷大了以后,會出現(xiàn)各種意想不到的問題,不一定是系統(tǒng)本身計(jì)算能力不行。”

第三種可能是安全問題

這個從工信部總工韓夏在陜西調(diào)研時強(qiáng)調(diào)的話中就可以一窺端倪。韓夏表示:“要切實(shí)加強(qiáng)網(wǎng)絡(luò)和信息安全,優(yōu)化應(yīng)急預(yù)案,強(qiáng)化安全防護(hù),排查安全隱患,防止出現(xiàn)網(wǎng)絡(luò)安全事故,出現(xiàn)問題要及時響應(yīng),快速修復(fù)。”

物聯(lián)網(wǎng)智庫在采訪時,也有多位專家提到了安全問題的可能性。比如,以前電商平臺會經(jīng)常出現(xiàn)被黑產(chǎn)薅羊毛的情況,類似的情形也會在一碼通亮碼的場景下發(fā)生,比如有的用戶手機(jī)上安裝了有缺陷的軟件,那該類軟件就會不停重復(fù)訪問行為,或者越是亮不了碼,用戶越是不停的重試,如果系統(tǒng)本身沒有安全機(jī)制,那就識別不了這種異常訪問。

第四種可能是數(shù)據(jù)庫和服務(wù)器的問題

有來自某IT大廠的專家猜測,可能是反向代理服務(wù)器崩了。反向代理服務(wù)器位于用戶與目標(biāo)服務(wù)器之間,但是對于用戶而言,反向代理服務(wù)器就相當(dāng)于目標(biāo)服務(wù)器,即用戶直接訪問反向代理服務(wù)器就可以獲得目標(biāo)服務(wù)器的資源。同時,用戶不需要知道目標(biāo)服務(wù)器的地址,也無須在用戶端作任何設(shè)定。反向代理服務(wù)器通??捎脕碜鳛閃eb加速,即使用反向代理作為Web服務(wù)器的前置機(jī)來降低網(wǎng)絡(luò)和服務(wù)器的負(fù)載,提高訪問效率,反向代理服務(wù)器崩了自然系統(tǒng)也就出問題了。

第五種可能是容災(zāi)和備份機(jī)制存在缺陷

所謂“容災(zāi)”,是指災(zāi)難發(fā)生時,在保證生產(chǎn)系統(tǒng)的數(shù)據(jù)盡量少丟失的情況下,保持生存系統(tǒng)的業(yè)務(wù)不間斷地運(yùn)行。“備份”則是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失,而將全系統(tǒng)或部分?jǐn)?shù)據(jù)集合從應(yīng)用主機(jī)的硬盤或陣列復(fù)制到其它的存儲介質(zhì)的過程,是數(shù)據(jù)高可用的最后一道防線,目的是為了系統(tǒng)數(shù)據(jù)崩潰時能夠恢復(fù)數(shù)據(jù)。

很容易理解,容災(zāi)和備份其實(shí)都是系統(tǒng)未雨綢繆的措施,如果容災(zāi)和備份機(jī)制做得足夠好的話,是完全可以在短時間內(nèi)恢復(fù)到昨天或者前天的狀態(tài)的。如果容災(zāi)和備份機(jī)制存在問題,那出了問題就沒有辦法及時得到解決。

從系統(tǒng)反反復(fù)復(fù)的表現(xiàn)看,西安一碼通雖有一定的備份機(jī)制,但是備份機(jī)制明顯不夠完善。

誰應(yīng)該為之“背鍋”?

出了問題的時候,除了分析問題的原因,還有一個大家都很關(guān)心的點(diǎn)在于“誰來為此負(fù)責(zé)”?

為了找到真正的“背鍋俠”,媒體們已經(jīng)把“西安一碼通”涉及的機(jī)構(gòu)和單位扒了個底兒朝天。

相關(guān)資料顯示,該數(shù)字化系統(tǒng)由西安市大數(shù)據(jù)資源管理局牽頭,中國電信西安分公司開發(fā)部署,于2020年2月25日在全市范圍內(nèi)推廣使用。參與西安“一碼通”安全工作的還有啟明、安恒、思安、東軟、阿里云、美林?jǐn)?shù)據(jù)等多家公司,從網(wǎng)絡(luò)、應(yīng)用、數(shù)據(jù)等多個層面為其提供安全防護(hù)。

根據(jù)公眾號“云頭條”的部分整理:

2020年3月1日,中國電信股份有限公司西安分公司發(fā)布《疫情聯(lián)控平臺一碼通項(xiàng)目》單一來源采購公示,單一來源采購供應(yīng)商為“西安東軟系統(tǒng)集成有限公司”。

 

2020年3月3日,西安電信發(fā)布《疫情聯(lián)控平臺一碼通項(xiàng)目-250臺掃碼設(shè)備應(yīng)急采購項(xiàng)目》單一來源采購公示,單一來源采購供應(yīng)商為“西安兆天系統(tǒng)工程有限責(zé)任公司”。

 

2020年7月13日,西安電信發(fā)布《“一碼通”應(yīng)用采買短信服務(wù)項(xiàng)目》中選人公示,阿里巴巴云計(jì)算(北京)有限公司中標(biāo)。

 

2021年10月25日,西安電信發(fā)布《2021年“一碼通”服務(wù)專席熱線業(yè)務(wù)外包項(xiàng)目》單一來源采購公示,單一來源采購供應(yīng)商為中通服旗下“陜西省通信服務(wù)有限公司中意科技分公司”。

 

2020年12月10日,西安電信發(fā)布《西安“一碼通”安全平臺項(xiàng)目》單一來源采購公示,單一來源采購供應(yīng)商為“杭州安恒信息技術(shù)股份有限公司 ”。

 

2020年12月10日,西安電信發(fā)布《西安“一碼通”大數(shù)據(jù)可視化分析項(xiàng)目》單一來源采購公示,單一來源采購供應(yīng)商為“中譯語通科技(陜西)有限公司  ”。

......

網(wǎng)友們對此評論:“哦,我知道原因了,原來是單一來源采購的鍋!”

事情發(fā)生后,立即有網(wǎng)友涌到相關(guān)企業(yè)的官方渠道下方留言詢問。

對此,安恒信息在互動平臺表示,公司在西安一碼通業(yè)務(wù)中負(fù)責(zé)部分應(yīng)用層安全防護(hù)及合規(guī)產(chǎn)品,以應(yīng)對可能存在的網(wǎng)絡(luò)攻擊和運(yùn)維風(fēng)險。自服務(wù)一碼通以來,公司長期安排技術(shù)人員值守,重點(diǎn)時期進(jìn)行24小時不間斷的監(jiān)測和保障,到目前為止,并無黑客攻擊導(dǎo)致業(yè)務(wù)問題的跡象。

上游新聞記者也曾多次致電西安一碼通的開發(fā)公司美林?jǐn)?shù)據(jù)以及運(yùn)營維護(hù)公司西安東軟,但兩家公司的聯(lián)系電話均處于可以撥通、無人接聽狀態(tài)。去年12月20日,西安一碼通首次出現(xiàn)故障之后,記者就撥打了美林?jǐn)?shù)據(jù)的公司和西安東軟的公司電話,當(dāng)時接聽熱線的工作人員對這一事件進(jìn)行了回應(yīng)。美林?jǐn)?shù)據(jù)的工作人員強(qiáng)調(diào)他們僅負(fù)責(zé)一碼通的后臺和賦碼算法,不負(fù)責(zé)運(yùn)營和維護(hù),因此崩潰與他們無關(guān)。西安東軟則不愿就一碼通崩潰原因做過多分析。

總結(jié)一下大家的回復(fù),“不知道,不清楚,不是我的鍋。”

北京數(shù)洋智慧科技有限公司CEO朱瑾鵬則對此表示:“說到責(zé)任這個話題,更應(yīng)該強(qiáng)調(diào)每個建設(shè)環(huán)節(jié)、每個參與者都應(yīng)該有相應(yīng)的認(rèn)責(zé)機(jī)制,才能做到各環(huán)節(jié)層層把關(guān),層層防護(hù),主動擔(dān)當(dāng)。”

以后如何“未雨綢繆”?

 

無論是尋找問題的根源,還是找到所謂的責(zé)任人,本意都是為了防患未然,避免再次發(fā)生。

在北京數(shù)洋智慧科技有限公司CEO朱瑾鵬看來,采取一些有效的手段和措施,杜絕類似問題的發(fā)生才是關(guān)鍵所在,而相關(guān)措施則可以分為事前、事中和事后三個方面。

首先,在事前,我們可以通過良好的架構(gòu)設(shè)計(jì)、有效的方案預(yù)審、評審等方式去避免系統(tǒng)設(shè)計(jì)缺陷,另外,系統(tǒng)還需要進(jìn)行充分的壓力與仿真測試。朱瑾鵬表示,“一碼通這個應(yīng)用雖然數(shù)據(jù)接口比較復(fù)雜,但是業(yè)務(wù)邏輯并不是很復(fù)雜,數(shù)據(jù)量容易測算,民眾在高峰期間訪問的行為模式也可以通過大數(shù)據(jù)算法仿真模擬,所以說應(yīng)該比較容易模擬類似的場景,當(dāng)前的測試與數(shù)據(jù)算法技術(shù)是完全具備支撐條件的。但從結(jié)果來看顯然是當(dāng)初壓力與仿真測試沒有做好,沒有預(yù)料到會出現(xiàn)現(xiàn)在這么一個極端負(fù)荷的情況。”

接著,在事中,應(yīng)通過技術(shù)、算法和主動運(yùn)維手段去實(shí)時監(jiān)控關(guān)鍵指標(biāo),做到主動監(jiān)控,甚至主動預(yù)警,一旦流量超過閾值或前兆預(yù)警指標(biāo)出現(xiàn)應(yīng)主動觸發(fā)排障機(jī)制,通過啟動備用線路、增加處理能力甚至系統(tǒng)降速等手段確保系統(tǒng)不宕機(jī)。

最后,在事后,系統(tǒng)遇到故障怎么搶修?從目前看前期預(yù)案考慮的不夠完善,技術(shù)、管理與運(yùn)維保障機(jī)制準(zhǔn)備不足,才會出現(xiàn)搶修慢以及屢次發(fā)生的情況

結(jié)語

文章的最后,想再強(qiáng)調(diào)一下,雖然西安此次應(yīng)對疫情出現(xiàn)了各種混亂和諸多問題,但也希望大家也能多給這座城市一點(diǎn)兒耐心和信心。

也由衷的祝愿我家鄉(xiāng)的親人和朋友們早日恢復(fù)平靜的生活。西安,加油~

最后的最后,對愿意為本文提供支持的5位業(yè)內(nèi)專家表示由衷的感謝~

作者:Sophia

參考資料:

1.《西安一碼通,兩個星期兩次崩潰,這到底為了什么?》,鋒利傳媒法治視野

2.《不堪重負(fù)!西安“一碼通”半個月內(nèi)再次故障,細(xì)數(shù)崩潰的N種可能》,智領(lǐng)云科技

3.《#西安一碼通#又崩了。。。誰之責(zé) ?》,云頭條

4.《西安“一碼通”系統(tǒng)崩潰背后:多家公司為其提供安全防護(hù)》,紅星新聞

相關(guān)推薦