每天收集健康雲上核酸檢測的二維碼截圖,核對檢測時間是否符合要求並逐個登記,這大約是疫情期間每個學校的老師和基層工作者都花費過大量時間的工作之一。復旦大學信息科學與工程學院博士生李小康勇用130行代碼讓原本需要1小時才能核查完上百人核酸完成截圖,變成在2分鐘內就能夠查完。“每一個人都在盡力守護着疫情中的學校和城市,我在做志願者之餘,用專業知識為抗疫做點事也是我的願望。”李小康説。
李小康既是博士生也是學院2019級信息1班輔導員。學校進入準封閉管理之後,幾乎每天都要開展全員核酸檢測,即便是這兩天頻率降低,也必須達到每天有20%的學生參加核酸滾動檢測。為確保每位學生都已參加,輔導員必須收集學生的“健康雲”截圖,如果核查發現有人還沒參加核酸,就要及時催促其儘快檢測,確保當天“不漏一人”。
“這個工作聽起來簡單,但實際做的時候卻既費時又枯燥,常常還容易看錯看漏。”李小康説,他自己管一個班級的學生,每天至少花1小時,他的同事高麗梅老師每次核對800個人的核酸截圖,需要幾個人一起才能在兩小時之內完成。
在李小康看來,核對核酸報告這種單調枯燥有費時的事情,正適合計算機幹。他開始嘗試寫程序了,程序寫好後在自己班級的核酸截圖數據上進行驗證,80多張圖只需要20秒,準確率卻很高,甚至檢測出了之前人工核查沒有發現的問題。這個程序立刻在信息學院“上崗”試用。
作為生物醫學工程專業博士生,李小康的研究方向是醫學影像與人工智能,他平常會接觸很多圖像處理方法。即使是在現在抗疫工作繁忙的情況下,導師汪源源和郭翌還是堅持每週找他討論科研進展,關心他的科研和生活,從未間斷。得益於長期的科研習慣和代碼敏感性,面對自動核查核酸截圖,李小康第一時間就想到以前學到過的OCR(Optical Character Recognition,光學字符識別)技術。
“OCR可以把圖像中的文字識別出來,轉換為文本信息,就方便用來核查了。而且因為核酸截圖是打印字體,識別率非常高,幾乎可以做到100%準確。”李小康説。一張截圖中的文本信息很多,包括脱敏處理的姓名、證件類型、證件號碼、採樣時間、組織機構等內容,其中,姓名、採樣時間、是否已採樣是最為關鍵,是需要檢索篩選出的內容。
3月15日,他花一個多小時就寫出了初始代碼,這個全新的小程序納入學校的網絡服務平台, “雖然原理也很簡單,只要是會寫代碼的人第一時間就會明白是怎麼回事,但是不做相關工作的感受不到這件事情的費時費力,自然也不會去思考是不是可以有更簡單的辦法。”李小康説,“我只是用我學到的知識解決實際工作中的困難而已”。
抗擊疫情,需要你我每個人的努力!
作者:殷夢昊
編輯:姜澎
責任編輯:姜澎
*文匯獨家稿件,轉載請註明出處。