比如說當學校的輔導員需要挨個檢查學生的核酸完成截圖,確保“不漏一人”,在面對幾百張重復性高的截圖時,稍不留神,就眼花看錯看漏了。、
為了減輕這種繁瑣耗時的工作量,一位來自復旦大學信息科學與工程學院的李小康寫出了130行的代碼,快速開發出一個小程序,提高了核酸核查的速度和精度,使得原來需要幾個人核對一個多小時的800幅截圖,現在只需2分鐘就能拿到結果!
用所學知識和技能減輕了疫情防控的壓力,大大提高了核查的效率和精度,李小康的事跡火上熱搜,《人民日報》也為他點贊:“知識就是力量!”
800幅截圖,1小時到2分鐘,一串代碼
三月以來,復旦大學啟動常態化核酸篩查工作,要求班級輔導員必須核查學生“健康云”核酸完成截圖,如果核查發現有人還沒參加核酸,就要及時催促其盡快檢測。
信息科學與工程學院的李小康,對這項繁瑣的日常工作產生了思考和行動。“這個工作聽起來好像很簡單,但實際做的時候,一個班級的截圖可能就需要花上半小時核查,如果是人數多的院系可能需要更久,還可能會看錯看漏。”
他認為這件事情單調枯燥又費時,重復性很強,正符合計算機程序的特點,所以就產生了“寫一個代碼程序用于自動核查核酸完成截圖”的想法。
程序一寫好,李小康就在自己班級的核酸截圖數據上進行驗證,準確率果然很高,甚至檢測出了之前人工核查沒有發現的問題。并且,程序運行時間很短,80多張圖只需要20多秒,800幅截圖,原來要幾個人枯燥核對一個多小時,現在只需等2分鐘就拿到結果,大大節約時間和人力!
程序原理不復雜,一個多小時跑通代碼
說起程序原理,李小康認為并不復雜。由于他長期對代碼敏感性,在面對自動核查核酸截圖時,李小康第一時間想到了曾經學過的OCR(光學字符識別)技術。
“OCR可以把圖像中的文字識別出來,轉換為文本信息,就方便用來核查了。而且因為核酸截圖是打印字體,識別率非常高,幾乎可以做到100%準確。”李小康說。
一張截圖中的文本信息很多,包括脫敏處理的姓名、證件類型、證件號碼、采樣時間、組織機構等內容,但不是所有信息都有用。其中,姓名、采樣時間、是否已采樣最為關鍵,是需要檢索篩選出的內容。
為此,李小康想到了Python語言中的正則表達式——可以搜索到字符串中的特定模式內容。“使用正則表達式就可以把想要的信息從OCR識別的文本中篩選出來。最后,確認好每張截圖里的姓名、檢測時間和是否已采樣等信息后,再把所有人的結果輸出到Excel文件中,方便人工確認。”
經過思考,李小康的程序思路就基本確定為OCR文字識別+正則表達式篩選,并且花了一個多小時就寫出了初始代碼,共130行,發現確實能夠跑通,且運行效率很高。其中也遇到了幾個技術難題——OCR技術的實現、學生提交截圖類型不統一、截圖數量多時的程序等待焦慮等。李小康逐一嘗試工具、分析圖像特點,尋找到了最佳解決方案。
學以致用,是一種幸運
談及開發程序的初衷,李小康表示自己只是為了減少自己和身邊老師的工作量。因為程序是用Python編寫的,代碼注釋也很完整,所以會使用Python的可以很快上手。為了方便不會編程的老師使用,李小康還把程序進行了封裝,只需簡單輸入一行代碼就能運行。
用李小康的原話來說:“雖然原理也很簡單,只要是會寫代碼的人第一時間就會明白是怎么回事,但是不做相關工作,感受不到這件事情的費時費力,自然也不會想出辦法。我只是用我學到的知識解決實際工作中的困難。”
以“培養緊缺型IT行業技能人才”著稱的北大青鳥職業教育,經常會對學員說“學好IT技能,你會成為一個受人尊重的專業人才”,就像上文中的李小康一樣,掌握了這項技能,還能夠學以致用,在各地疫情嚴峻的時期,減輕抗疫工作者的時間壓力,這何嘗不是學習者的一種幸運!
?
我們相信知識就是力量,也相信技能會改變生活,當我們真正把知識和技能用在生活中,才會發現自己是最大的受益人。所以趁著年輕,多學習多改變自己,作為企業發展中亟需的專業人才,成為對社會有用的人!
如果你想了解更多IT技能,歡迎來電咨詢:400-8035-955