行業(yè)研究|基于支持向量機回歸的城市排水窨井水位預(yù)測發(fā)表時間:2025-07-18 10:03 來源:中國給水排水 ![]() 【摘要】為實時掌握城市排水管網(wǎng)水位狀態(tài),減少水位監(jiān)測設(shè)備長期運行的維護(hù)成本,本文通過獲取排水窨井水位及降雨量短期監(jiān)測數(shù)據(jù),分析水位站點水文特征因子,制作樣本數(shù)據(jù)集,并對支持向量機回歸算法進(jìn)行優(yōu)化訓(xùn)練,構(gòu)建城市排水窨井水位預(yù)測模型,最后利用典型天氣數(shù)據(jù)對模型進(jìn)行測試,模型預(yù)測結(jié)果精度良好。與長期布設(shè)窨井水位傳感器開展長期監(jiān)測相比,該方法通過獲取短期水位數(shù)據(jù)即可對窨井實時水位預(yù)測,具有部署方便、運維成本低特點,在城市排水日常提質(zhì)增效運維、內(nèi)澇應(yīng)急調(diào)度等業(yè)務(wù)應(yīng)用中具有較高的實用價值。 【關(guān)鍵字】城市排水系統(tǒng);水位預(yù)測;支持向量機回歸;提質(zhì)增效 城市排水管網(wǎng)高水位運行是外水入侵排水系統(tǒng)最直觀的表現(xiàn)。排水管網(wǎng)高水位運行,導(dǎo)致管網(wǎng)水體流速降低,污染物沉積管道,受降雨二次沖刷影響,污染物隨水體溢流入受納水體,易引起水體黑臭,二次危害巨大。對排水管網(wǎng)水位運行狀態(tài)進(jìn)行實時監(jiān)測,識別排水管網(wǎng)高水位風(fēng)險,能有效輔助排查排水管網(wǎng)缺陷,為排水運維調(diào)度、系統(tǒng)設(shè)計改造提供決策依據(jù),助力排水系統(tǒng)提質(zhì)增效[1]。 在排水系統(tǒng)中布設(shè)在線監(jiān)測設(shè)備是獲取地下管井實時水位、識別高水位風(fēng)險的有效手段。長期在線監(jiān)測條件下,由于管井內(nèi)部環(huán)境惡劣,監(jiān)測設(shè)備易腐蝕損壞,且需定期更換電池及零件,后期運維成本高;短期監(jiān)測能夠輔助問題分析,但不能滿足在線實時監(jiān)測及預(yù)警需求[2]。 針對上述問題,本文考慮降雨因素,收集短期窨井在線水位監(jiān)測數(shù)據(jù)及雨量監(jiān)測數(shù)據(jù),應(yīng)用支持向量機(SVM)回歸算法,構(gòu)建城市排水系統(tǒng)窨井水位預(yù)測模型;基于預(yù)測模型,根據(jù)地面降雨監(jiān)測數(shù)據(jù)實時預(yù)測地下窨井水位,識別管井高水位風(fēng)險運行狀態(tài),以期為排水系統(tǒng)運維監(jiān)測提供低成本解決方案。 1 支持向量機回歸 近年來,機器學(xué)習(xí)算法在城市市政排水應(yīng)用中越來越廣泛[3-4]。支持向量機是在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來的一種新的、通用的機器學(xué)習(xí)方法,能夠解決小樣本、非線性和高維數(shù)等實際難題,可以使在小樣本下建立的分類器具有很強的推廣能力。為支持回歸問題,Drucker等將其拓展到支持向量回歸算法(SVMR),管井水位預(yù)測屬于非線性回歸預(yù)測問題,因此,選擇SVMR進(jìn)行模型構(gòu)建[5]。 SVMR的基本思想是通過一個非線性映射Φ,將數(shù)據(jù)Xi映射到某一高維空間F中進(jìn)行線性回歸。給定數(shù)據(jù)集{Xi,Yi},(i=1,2,…,1),Xi∈Ri為n維的輸入向量,Yi∈R為輸出向量,構(gòu)建SVMR的決策函數(shù)。為保證決策函數(shù)平坦,假設(shè)所有訓(xùn)練數(shù)據(jù)都可以在一定精度下用線性函數(shù)擬合,考慮到允許擬合誤差情況,引入松弛變量,將尋優(yōu)問題表示為凸優(yōu)化問題,采用Lagrange乘子得到原始問題的對偶優(yōu)化問題,求解該問題可獲得支持向量機的回歸函數(shù)。 2 案例分析 2.1 研究區(qū)域概況 研究區(qū)位于南方某城某河涌中游區(qū)域,該區(qū)域污水匯入沿河涌敷設(shè)一條污水主干管,主干管下游連接污水處理廠。由于管網(wǎng)破損、雨污分流不徹底等因素,雨季條件下存在雨水入流入滲問題,易導(dǎo)致主干管滿管運行、下游污水廠進(jìn)水量增大、進(jìn)廠污染物濃度偏低等問題。為緩解污水廠壓力、降低主干管淤積風(fēng)險,當(dāng)管道水位達(dá)到一定高度時,則實行人工調(diào)度措施管理。為實時掌握主干管水位運行情況,輔助運行調(diào)度,主干管沿途窨井內(nèi)部布設(shè)水位監(jiān)測設(shè)備用于監(jiān)測管網(wǎng)水位,并在區(qū)域布設(shè)多個雨量站點用于監(jiān)測雨情。但由于主干管來水環(huán)境復(fù)雜,窨井監(jiān)測設(shè)備經(jīng)常受垃圾遮擋、酸性液體腐蝕等影響,需定期維護(hù),增加了運維成本。 研究區(qū)概況見圖1。主干管收集周邊排水單元產(chǎn)生的污水;從上游到下游,依次布設(shè)水位站點1~4用于監(jiān)測窨井水位數(shù)據(jù);區(qū)域內(nèi)布設(shè)雨量站點1和2用于監(jiān)測降雨量;河涌內(nèi)布設(shè)河道水位站點1用于監(jiān)測河道實時水位。水位站點及雨量站點測量頻率均為5min。該研究選取水位站點3作為窨井水位建模站點(下稱“站3”),雨量站點1作為站3主關(guān)聯(lián)雨量站,其他站點數(shù)據(jù)用于建模輔助。 ![]() 圖1 研究區(qū)域概況 2.2 水文特征分析 根據(jù)站3周邊環(huán)境初步分析,污水系統(tǒng)外水來源主要包括地下水入滲、降雨入流入滲、河湖水倒灌等。通過對站3與河道水位站點1常水位分析,河涌水位遠(yuǎn)低于排水管網(wǎng)敷設(shè)高度,可排除河涌水位倒灌影響。為提高SVMR算法學(xué)習(xí)效率,保證城市排水管網(wǎng)窨井水位預(yù)測模型建設(shè)質(zhì)量,本文對站3旱季、雨季水文特征進(jìn)一步分析,提取水位影響因子,為特征樣本提取提供依據(jù)。 2.2.1旱季規(guī)律分析 選取典型旱季天氣進(jìn)行旱季流水位曲線規(guī)律分析,旱季天氣選取標(biāo)準(zhǔn):①日累計降雨為5mm以下;②旱季時間跨度不宜少于連續(xù)7d;③降雨結(jié)束至少48h后,以排除前一場降雨的影響。 對選取的旱季數(shù)據(jù)中無效數(shù)據(jù)進(jìn)行人工剔除,以確保數(shù)據(jù)精度,剔除標(biāo)準(zhǔn):①為確保雨量站點1監(jiān)測數(shù)據(jù)可靠性,對雨量站點1與站點2日累計降雨量進(jìn)行校驗,若相互偏差大于5mm,則剔除該日旱季數(shù)據(jù);②為確保站3監(jiān)測數(shù)據(jù)可靠性,剔除數(shù)據(jù)中存在數(shù)據(jù)缺失、零值情況。 采用以上標(biāo)準(zhǔn),選取7個工作日,6個非工作日旱季流水位監(jiān)測數(shù)據(jù)集,并分別進(jìn)行疊加,繪制旱季水位變化曲線,如圖2a、圖2b所示??梢钥闯?,站3水位高峰出現(xiàn)在每日凌晨01:00左右,水位低谷出現(xiàn)在每日07:00左右;隨著每日時間推移,整體變化規(guī)律一致性較強,不同時日同一時刻水位波動差異較小,呈現(xiàn)以日為單位周期變化規(guī)律,滿足一般旱季規(guī)律。分析表明,站點來水環(huán)境相對穩(wěn)定,存在突發(fā)異常排放可能性較小。 ![]() 圖2a 工作日旱季水位監(jiān)測數(shù)據(jù)疊加曲線 ![]() 圖2b 非工作日旱季水位監(jiān)測數(shù)據(jù)疊加曲線 2.2.2雨季降雨入流入滲分析 為分析站3水位受降雨入流入滲的影響,選取12月及5月監(jiān)測數(shù)據(jù),分別對雨量站點1降雨及站3水位監(jiān)測數(shù)據(jù)進(jìn)行疊加分析,結(jié)果如圖3a、圖3b所示。可以看出,旱季流呈周期規(guī)律性;降雨情況下,站3受降雨影響水位明顯上漲,水位深度與降雨量呈正相關(guān);降雨結(jié)束后,水位慢慢恢復(fù)到正常水平。這表明,站3為典型受降雨入流入滲影響站點,上游排水管網(wǎng)可能存在破損、雨污分流不徹底等問題。 ![]() 圖3a 12月降雨與水位疊加過程線 ![]() 圖3b 5月降雨與水位疊加過程線 綜上可知,站3水位時序過程線與日時刻、降雨量均有極大相關(guān)性。為能夠準(zhǔn)確描述站3水位變化規(guī)律,充分表達(dá)地表徑流、土壤滲流、管網(wǎng)匯流對水位曲線變化的影響,本文選取日小時數(shù)及雨量站點1的5min、10min、15min、30min、1h、2h、3h、4h、6h、12h、24h、48h累計降雨量作為特征因子。 2.3 模型構(gòu)建 2.3.1樣本制作 考慮兼顧雨季及旱季水位特征,選取2022年4月—7月以及11月—12月等6個月的監(jiān)測數(shù)據(jù)制作樣本集。對數(shù)據(jù)進(jìn)行預(yù)處理,剔除數(shù)據(jù)存在缺失、零值等異常值的數(shù)據(jù),具體原則如下:①剔除雨量站點1日監(jiān)測數(shù)據(jù)缺失率大于5%的天數(shù);②剔除水位站3日監(jiān)測數(shù)據(jù)缺失率或零值大于5%的天數(shù);③剔除雨量站點1與雨量站點2日降雨累積量偏差大于10mm的天數(shù)。最后得到48426條樣本數(shù)據(jù)。 從整體樣本數(shù)據(jù)中選擇6d典型旱季及雨季天氣作為測試數(shù)據(jù),包括2022年11月11日旱季工作日;2022年11月13日旱季非工作日;2022年11月7日,累計降雨量為9.5mm的小雨;2022年6月1日,累計降雨量為23.5mm的中雨;2022年4月24日,累計降雨量為36mm的大雨;2022年5月1日,累計降雨量為69mm的暴雨。 2.3.2參數(shù)優(yōu)化 本文選擇徑向基函數(shù)作為SVRM核函數(shù)。SVRM的性能與超參數(shù)選取有很大的關(guān)系,研究表明主要超參數(shù)包括核參數(shù)σ、懲罰參數(shù)C、損失參數(shù)ε。為選取合適的超參數(shù),防止模型過擬合及欠擬合,充分評價模型超參數(shù)[σ、C、ε]組合優(yōu)劣程度,使用遺傳算法優(yōu)化參數(shù)選擇,采用K折交叉方法及均方根誤差(RMSE)衡量指標(biāo)驗證模型優(yōu)劣程度,具體步驟如下[6]:①將實際問題數(shù)值化,轉(zhuǎn)化成SVMR可以處理的數(shù)據(jù)格式;②為消除樣本在數(shù)值上相差較大的影響,提高模型的精度,對樣本進(jìn)行歸一化處理;③根據(jù)數(shù)據(jù)特征,預(yù)設(shè)超參數(shù)的取值范圍,其中σ取值范圍為[0-5],C取值范圍為[0-10],ε取值范圍為[0-0.1],設(shè)置種群規(guī)模為50,最大迭代30次;④采用10折交叉驗證方法評估參數(shù)組合優(yōu)劣;⑤利用遺傳算法對超參數(shù)進(jìn)行優(yōu)化,求RMSE最小化問題。通過上述方法,最終得到最優(yōu)參數(shù)σ為2.561、C為0.898、ε為0.0768。 2.3.3模型測試 為驗證模型可靠性,利用最優(yōu)參數(shù)[σ、C、ε]建立SVRM預(yù)測模型,分別利用6場測試數(shù)據(jù)對窨井液位進(jìn)行預(yù)測,計算預(yù)測值與實測值的RMSE和決定系數(shù)R2對模型進(jìn)行評價。結(jié)果表明,旱季非工作日、旱季工作日、小雨、中雨、大雨、暴雨測試集的RMSE分別為0.0537、0.045、0.057、0.046、0.0458、0.0513,R2分別為0.8453、0.8865、0.7322、0.9695、0.5442、0.7528。 預(yù)測數(shù)據(jù)與實測數(shù)據(jù)曲線如圖4a、4b、4c、4d、4e、4f所示。 ![]() 圖4a 旱季工作日實測與預(yù)測水位對比圖 ![]() 圖4b 旱季非工作日實測與預(yù)測水位對比圖 ![]() 圖4c 小雨條件下實測與預(yù)測水位對比圖 ![]() 圖4d 中雨條件下實測與預(yù)測水位對比圖 ![]() 圖4e 大雨條件下實測與預(yù)測水位對比圖 ![]() 圖4f 暴雨條件下實測與預(yù)測水位對比圖 通過分析模擬結(jié)果可知,模型對6場典型旱季及雨季數(shù)據(jù)模擬的RMSE均小于0.06、決定系數(shù)R2均大于0.5,預(yù)測值與實際觀測值的差異較小,擬合效果較好,精度能夠滿足一般基于管網(wǎng)水位預(yù)測的業(yè)務(wù)應(yīng)用要求。 對比旱季與雨季測試結(jié)果,雨季預(yù)測效果穩(wěn)定性相對較差,主要原因是:①由于雨季降雨雨型復(fù)雜、產(chǎn)匯流環(huán)境不確定因素較多導(dǎo)致管網(wǎng)液位特征不規(guī)律,加上雨季樣本占整體樣本量比例較少,雨季模型訓(xùn)練欠佳。可通過增加雨季樣本量進(jìn)一步提高模型對雨季預(yù)測穩(wěn)定性。②該研究使用單一雨量計數(shù)據(jù)制作樣本進(jìn)行模型訓(xùn)練,而污水管網(wǎng)上游匯水區(qū)實際降雨一般存在空間分布差異特征,模型輸入降雨量與實際降雨量不一致,導(dǎo)致雨季模型預(yù)測結(jié)果變差。可通過管網(wǎng)上游匯水區(qū)布設(shè)多個雨量站點,再根據(jù)每個站點降雨量插值模擬空間分布差異的降雨特征解決該問題。 3 結(jié)論 ①窨井水位站點3旱季天水位曲線整體變化規(guī)律一致性較強,不同時日同一時刻水位波動差異較小,呈現(xiàn)以日為單位的周期變化規(guī)律,來水環(huán)境相對穩(wěn)定,異常排放情況存在可能性較小;雨季天水位受降雨影響比較大,與降雨量呈正相關(guān),上游排水管網(wǎng)可能存在管道破損、雨污分流不徹底等問題。 ②通過選取日時刻及不同時段累計降雨量作為建模特征因子、窨井水位作為建模目標(biāo)變量,對模型進(jìn)行訓(xùn)練驗證、測試,測試結(jié)果與實際值擬合程度高,模型預(yù)測可靠性良好。基于水位預(yù)測模型,在不布設(shè)管井水位傳感器條件下,通過地面降雨監(jiān)測數(shù)據(jù),能夠預(yù)測地下窨井水位實時水深,與長期布設(shè)窨井水位物聯(lián)網(wǎng)監(jiān)測設(shè)備相比,具有部署方便、運維成本低優(yōu)點,對于城市排水日常調(diào)度、內(nèi)澇應(yīng)急決策等具有較高的使用價值。 ③與長期實時監(jiān)測方法相比,該方法也存在一定的不足。由于模型建立需依賴流域歷史水文樣本數(shù)據(jù),若流域發(fā)生城市更新、管網(wǎng)改造等對流域產(chǎn)匯流環(huán)境產(chǎn)生影響的活動,已建立的模型模擬結(jié)果可能與實際監(jiān)測數(shù)據(jù)具有較大的偏差,模型適用性變差。為提高模型的可靠性,需重新收集流域樣本數(shù)據(jù)、分析特征因子,并對模型進(jìn)行訓(xùn)練及驗證。 參考文獻(xiàn) [1]張旭東,馬振華,王海玲,等.基于排水系統(tǒng)提質(zhì)增效的集約治滇探索與實踐[J].中國給水排水,2022,38(4):125-132. [2]趙冬泉,王浩正,陳吉寧,等. 監(jiān)測技術(shù)在排水管網(wǎng)運行管理中的應(yīng)用及分析[J]. 中國給水排水,2012,28(8):11-14. [3]Yan J,Jin J, Chen F,et al.Urban flash flood forecast using support vector machine and numerical simulation[J]. Journal of hydroinformatics,2018,20(1/2):221-231. [4]黃華兵,王先偉,柳林.城市暴雨內(nèi)澇綜述:特征、機理、數(shù)據(jù)與方法[J].地理科學(xué)進(jìn)展,2021,40(06):1048-1059. [5]李航. 統(tǒng)計學(xué)習(xí)方法[M]. 清華大學(xué)出版社, 2012:95-134. [6]杜長海. 基于磷蝦群算法的SVR參數(shù)選取方法及其應(yīng)用[J]. 自動化技術(shù)與應(yīng)用,2016,35(5):10-14,19. |