談起污水處理的大數據和人工智能,大家想到的大多是曝氣自動化、投藥自動化。但你有沒有聽過,圖像識別的ai技術如今在污水處理廠也得到應用的呢?它的前景已經受到多家水務工程公司的青睞,其中包括了丹麥的ramboll公司,2021年,該公司發布了一款名為opseyes的人工智能系統,聲稱僅憑顯微鏡拍攝的圖片,就能對污水廠生化池的污泥進行快速分析。
來自醫學界的靈感
這個名叫opseyes的系統的創始人叫bryan arndt,他是ramboll公司的管理顧問,有著豐富的污水廠運行管理經驗。bryan有個親生兄弟,是個放射科的醫生。
早在幾年前,bryan和他的兄弟聊起了深度學習(deep learning),他的兄弟說圖像識別技術已經實實在在地幫助放射科醫生們分析人體圖像。這也讓bryan意識到,這技術是不是能用到污水處理上呢?
污水廠哪里有圖像識別的需求呢?
答案在實驗室的顯微鏡里。
縮短分析時間
如果你工作的污水廠的實驗室配有顯微鏡,那么你可以借助它觀察微生物的組成,統計污水樣品中的原生動物的組成情況,來判斷污泥泥齡及其沉降性能。
有些國外學者還將他們這些鏡檢經驗整理成類似下圖的對應關系圖,幫助運行人員了解污水廠的污泥處于什么狀態。如果你剛好是從事污水廠的微生物鏡檢工作的專家,對此圖應該不會陌生。
在美國,雖然不少污水處理廠的實驗室有顯微鏡,但真能識別出不同微生物的專家并不多,因此,當污水處理廠若想要得到較為專業的微生物鏡檢報告,需要將污水樣品寄到相應的第三方機構進行分析。顯然這種做法相當耗時,而且得五天以上 (因為通常還會分析其他指標,包括bod5)。對于追求實時性的污水運行人員來說,這時間是耗不起的。
在他兄弟的啟發下,bryan arndt心想:能不能像其他行業那樣,運用深度學習來訓練 ai ,讓ai識別出污水各種微生物的照片,并根據這些照片即時生成廢水分析的結果?
污水的大數據
bryan arndt的想法得到了公司的支持,并開始組建小團隊。同時聯系美國各地污水廠的同行,邀請他們給他寄些污水廠的樣品。
基于這些樣品,他和他的團隊在隨后的幾個月里,積累了6000多張圖片。在外行人看來,這些圖片絕對不是什么美圖,甚至有點惡心,但在小編看來,bryan arndt和他的團隊做的是開荒牛的好事。他們把收集的圖片打包發給了位于德國的同事 robin schlenga。德國的團隊用卷積神經網絡(convolutional neural network, cnn)來處理這些圖像文件。
這里又要說個題外話,這次圖像分析用到了英偉達公司的獨立顯卡。小編猜測也許是英偉達公司的品牌管理團隊覺得污水處理和人工智能的跨界十分新奇,因此在2021年的2月和6月相繼在其官網博客報道了這個項目,甚至制作了音頻播客,這才讓小編了解到這則新聞,也才有了搬磚的素材。而小編也是因此才知道,顯卡的錢省不了,因為好的顯卡確實能大大縮短數據分析時間的(應該會比讓碼農閑著白等劃算)。
沒那么簡單
美國人bryan arndt剛聯系德國同事robin schlenga的時候,覺得這項目挺簡單的——不就是給ai一些圖片,ai就能把圖片的細菌一一認出來了嗎?robin說遠沒有這么簡單,花了好些時間給bryan解釋,才讓后者明白為何如果鏡檢專家不能為數據團隊提供足夠的標簽信息,數據團隊是沒法開展工作。
robin在采訪中解釋了這背后的兩個原因:第一是定性的難度,因為顯微鏡的圖片里往往有許多種細菌,而不是大家熟悉的簡單的一圖一物的識別任務;第二是定量的難度,這個系統能認出有什么細菌還不夠,必須需要根據圖片,判斷各種細菌的數量,分出個名次。
由于第一批圖片的質量不能滿足數據分析團隊的要求,所以robin硬著頭皮要求bryan重新采樣拍照。而這其實也讓bryan很為難,因為他也要向鏡檢專家們解釋一番,這些鏡檢專家雖然不懂ai,但長年累月看過成千上萬張微生物照片,已能輕松對每張圖片出現的微生物進行描述,而robin訓練的ai最初只能認出2-3種細菌,這難免會讓非ai專業的專家質疑碼農們的水平。幸好bryan最終還是能做好兩邊的溝通工作,確保項目得以延續。
經過超過一年半時間的開發,opseyes總算達到了他們內部滿意的版本——2020年9月,他們正式發布的1.0版。在此版本里,用戶將智能手機通過一個固定架綁在顯微鏡上,并對觀察到的樣本進行拍照,照片經上傳后,系統會在幾分鐘內返回分析結果。
而早在2020年8月,一個叫bruce the water guy的up主分享了一個視頻——他收到了opseyes的 內測安裝包,邀請他進行評測。下圖就是他在實驗室拍的視頻截圖。可惜他在視頻里并沒有分享分析報告的內容,而且表示他能收到的只是一份報告的初稿,還不算正式的報告。而除了這個視頻,小編也沒有再找到其他相關第三方評測結果的消息,因此無法評價這個軟件目前的實際分析水平。
未來的潛能
讀到這里,你是否會問:那么這套機器學習系統除了識別污泥狀態,還有什么其他用途呢?
bryan arndt在采訪中也被問到此問題,他表示:他的團隊正在考察能這套系統拓展到藻華爆發預警的可行性。
在小編看來,這套機器學習系統的當務之急還是要積累更多令人信服的實測數據,過早的收費不利于自身系統的完善。盡管如此,它的面世還是帶來很多積極意義的,它不僅幫助運行人員了解污水處理系統的運行狀況,更重要的是讓污水處理行業進一步認識到專業知識和人工智能之間的邊際要消融。換句話說,以后會有越來越多既懂污水處理又懂計算機的人才需求。
robin在采訪中也說到:“其實此前很多所謂的機器學習大多集中在互聯網和金融領域,工程領域是在最近才開始對機器學習有更深入的探索和研究。” 他也表示非常歡迎更多的it人才加入這些工程領域中來。
(來源:中國水星網)