圖說:擔任志愿者的李小康 采訪對象供圖
自三月初以來,復旦大學啟動常態(tài)化核酸篩查工作,要求班級輔導員必須核查,學生“健康云”核酸完成截圖,確?!安宦┮蝗恕?。人工核查費時費力又易出錯怎么辦?復旦信息科學與工程學院博士生李小康快速開發(fā)一項小程序,幾分鐘就能快速核查數(shù)百人的核酸完成截圖,大大提高核查效率和精度。
李小康擔任學院2019級信息1班輔導員。學校進入準封閉管理之后,忙于抗疫的他,對一項繁瑣的日常工作產(chǎn)生了思考。原來,近期學校經(jīng)常需要開展全員核酸檢測,為確保每位在校學生都已參加,學校要求每位班級輔導員都要收集學生的“健康云”截圖,如果核查發(fā)現(xiàn)有人還沒參加核酸,就要及時催促其盡快檢測,確保當天“不漏一人”。
“這個工作聽起來好像很簡單,但實際做的時候,一個班級的截圖可能就需要花上半小時核查,如果是人數(shù)多的院系可能需要更久,還可能會看錯看漏。”李小康說。
寫一個代碼程序用于自動核查核酸完成截圖的想法,在他腦海中產(chǎn)生。程序一寫好,李小康就在自己班級的核酸截圖數(shù)據(jù)上進行驗證,準確率果然很高,甚至檢測出了之前人工核查沒有發(fā)現(xiàn)的問題。并且,程序運行時間很短,80多張圖只需要20多秒,大大節(jié)約時間和人力。
后來,李小康了解到,信息科學與工程學院研工組組長高麗梅每次需要核查學院所有研究生的核酸截圖,要花很長時間,特別辛苦。為了減輕高老師的工作負擔,李小康也讓她使用自己的程序進行核查。800幅截圖,原來要幾個人枯燥核對一個多小時,現(xiàn)在只需等2分鐘就拿到結果。程序目前已在該學院服務2周。
說起程序原理,李小康認為并不復雜。作為生物醫(yī)學工程專業(yè)博士生,研究方向是醫(yī)學影像與人工智能,他平常會接觸很多圖像處理方法。即使是在現(xiàn)在抗疫工作繁忙的情況下,導師汪源源老師和郭翌老師還是堅持每周找他討論科研進展,關心他的科研和生活,從未間斷。得益于長期的科研習慣和代碼敏感性,面對自動核查核酸截圖這件事情,李小康第一時間想到以前學到過的OCR (Optical Character Recognition,光學字符識別)技術。
“OCR可以把圖像中的文字識別出來,轉(zhuǎn)換為文本信息,就方便用來核查了。而且因為核酸截圖是打印字體,識別率非常高,幾乎可以做到100%準確?!崩钚】嫡f。
一張截圖中的文本信息很多,包括姓名、證件類型、證件號碼、采樣時間、組織機構等內(nèi)容,但不是所有信息都有用。其中,姓名、采樣時間、是否已采樣最為關鍵,是需要檢索篩選出的內(nèi)容。經(jīng)過思考,李小康的程序思路就基本確定為OCR文字識別+正則表達式篩選。說干就干。3月15日晚,他花了一個多小時就寫出了初始代碼,共130行,發(fā)現(xiàn)確實能夠跑通,且運行效率很高。
李小康說,自己開發(fā)這個程序的初衷是為了減少自己和身邊老師的工作量。據(jù)悉,復旦信息辦已與李小康對接?!八乃悸泛妥龇ńo我們很大啟發(fā)。”相關負責人介紹,正在收集二級單位管理需求,研究制定相關方案,開發(fā)全新小程序納入學校“一網(wǎng)通辦”平臺。預計在不久的將來,師生們就可不用再通過微信手動收集核酸截圖,而是通過小程序直接上傳圖片,二級單位負責人可在后臺隨時查看統(tǒng)計結果。
新民晚報記者 張炯強 通訊員 殷夢昊