核酸報告核查太繁瑣?復旦博士生寫了130行代碼搞定
東方網記者傅文婧、通訊員殷夢昊4月7日報道:打開“健康云”、將核酸報告截圖、上傳提交統計……這一套操作已經是大學校園里師生配合疫情防控的“常規動作”。但人工核查往往費時費力,又容易出錯怎么辦?復旦大學信息科學與工程學院博士生李小康日前開發出一項小程序,幾分鐘就能快速核查數百人的核酸并完成截圖,大大提高了核查效率和精度。
從1小時到2分鐘
信息科學與工程學院生物醫學工程專業博士生李小康,擔任學院2019級信息1班輔導員。學校進入準封閉管理之后,忙于抗疫的他,對一項繁瑣的日常工作產生了思考。原來,近期學校經常需要開展全員核酸檢測,為確保每位在校學生都已參加,學校要求每位班級輔導員都要收集學生的“健康云”截圖,如果核查發現有人還沒參加核酸,就要及時催促其盡快檢測,確保當天“不漏一人”。

李小康擔任志愿者
“這個工作聽起來好像很簡單,但實際做的時候,一個班級的截圖可能就需要花上半小時核查,如果是人數多的院系可能需要更久,還可能會看錯看漏!崩钚】嫡f。
他想,這件事情單調枯燥又費時,重復性很強,正符合計算機程序的特點。寫一個代碼程序用于自動核查核酸完成截圖的想法,在他腦海中產生。
程序一寫好,李小康就在自己班級的核酸截圖數據上進行驗證,準確率果然很高,甚至檢測出了之前人工核查沒有發現的問題。并且,程序運行時間很短,80多張圖只需要20多秒,大大節約時間和人力。
后來,李小康了解到,信息科學與工程學院研工組組長高麗梅每次需要核查學院所有研究生的核酸截圖,要花很長時間,特別辛苦。為了減輕高老師的工作負擔,李小康也讓她使用自己的程序進行核查。800幅截圖,原來要幾個人枯燥核對一個多小時,現在只需等2分鐘就拿到結果。程序目前已在該學院服務2周。

一個多小時跑通代碼
說起程序原理,李小康認為并不復雜。作為生物醫學工程專業博士生,研究方向是醫學影像與人工智能,他平常會接觸很多圖像處理方法。即使是在現在抗疫工作繁忙的情況下,導師汪源源老師和郭翌老師還是堅持每周找他討論科研進展,關心他的科研和生活,從未間斷。得益于長期的科研習慣和代碼敏感性,面對自動核查核酸截圖這件事情,李小康第一時間想到以前學到過的OCR (Optical Character Recognition,光學字符識別)技術。
“OCR可以把圖像中的文字識別出來,轉換為文本信息,就方便用來核查了。而且因為核酸截圖是打印字體,識別率非常高,幾乎可以做到100%準確!崩钚】嫡f。
一張截圖中的文本信息很多,包括脫敏處理的姓名、證件類型、證件號碼、采樣時間、組織機構等內容,但不是所有信息都有用。其中,姓名、采樣時間、是否已采樣最為關鍵,是需要檢索篩選出的內容。
為此,他想到了Python語言中的正則表達式——可以搜索到字符串中的特定模式內容!笆褂谜齽t表達式就可以把想要的信息從OCR識別的文本中篩選出來。最后,確認好每張截圖里的姓名、檢測時間和是否已采樣等信息后,再把所有人的結果輸出到Excel文件中,方便人工確認!
經過思考,李小康的程序思路就基本確定為OCR文字識別+正則表達式篩選。說干就干。3月15日晚,他花了一個多小時就寫出了初始代碼,共130行,發現確實能夠跑通,且運行效率很高。
當然,當中也遇到了幾個技術難題——OCR技術的實現、學生提交截圖類型不統一、截圖數量多時的程序等待焦慮等。李小康逐一嘗試工具、分析圖像特點,尋找到了最佳解決方案。

程序輸出的Excel文件
未來有望覆蓋全校
李小康說,自己開發這個程序的初衷是為了減少自己和身邊老師的工作量!半m然原理也很簡單,只要是會寫代碼的人第一時間就會明白是怎么回事,但是不做相關工作的感受不到這件事情的費時費力,自然也不會想出辦法。我只是用我學到的知識解決實際工作中的困難!彼f。
李小康把這件事發到朋友圈之后,不少學工的同事表示很感興趣,他也把代碼分享了出去,讓有需求的老師們都能及時使用。
“因為程序使用python語言編寫,代碼注釋也寫得很完整,只要會使用python,就可以很快上手!睘榱朔奖悴粫幊痰睦蠋熓褂,李小康最后還把程序進行了封裝!按蠹倚枰玫臅r候,只要在命令行輸入一行代碼就可以運行,非常簡單!
據悉,學校信息辦已與李小康對接!八乃悸泛妥龇ńo我們很大啟發!毕嚓P負責人介紹,正在收集二級單位管理需求,研究制定相關方案,開發全新小程序納入學!耙痪W通辦”平臺。預計在不久的將來,師生們就可不用再通過微信手動收集核酸截圖,而是通過小程序直接上傳圖片,二級單位負責人可在后臺隨時查看統計結果。
分享讓更多人看到
相關新聞
- 評論
- 關注
























第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量