近年來,基於神經網絡算法預測PM2.5成為PM2.5監測[1]研究的熱點。
人工神經網絡具有很好的自適應性、自組織性和很強的自主學習能力[2-4]。採用人工神經網絡的方式去預測PM2.5濃度值具備很高的適用性[5]。但是直接採用典型的神經網絡方法在收斂速度和泛化能力上並不理想,所以一些學者通過用相關性分析的方法降低輸入樣本的維度,可以在一定程度上解決收斂速度的影響。張怡文和李鳳英等人分別採用了逐步迴歸和Pearson相關係數的方法分析影響PM2.5相關因素的相關性,降低輸入樣本的維數,以此來提高算法的收斂速度[6-7]。針對常用的幾種神經網絡用於預測PM2.5濃度值的方法存在的局部極值問題,馬天成等人則是將粒子羣算法(Particle Swarm Optimization,PSO)與模糊神經網絡進行融合,發揮PSO算法全局尋優的特點,預測PM2.5顆粒物濃度的變化規律[8];荊濤、李霖等人通過遺傳算法與BP(Back Propagation)神經網絡算法相結合的方式也解決了BP神經網絡算法訓練過程中的局部極值問題[9]。PM2.5數據及其相關影響因素數據都是具有一定時間相關性的時間序列數據,其具備一定的歷史特性,而BP神經網絡模型對這種特性無法進行有效的表達。裴雨瀟等人通過把PM2.5的數據構成時間序列,並進行小波變換,將低頻部分和高頻部分分別用不同的模型進行預測,再將預測值進行疊加,最後得到的結果比單純用BP神經網絡模型預測的效果要理想[10]。目前國內外研究PM2.5預測模型多是基於神經網絡結合其他算法進行模型的改進,這種方式相對比單純用神經網絡的方式在預測精度、泛化能力上都有較大的提升,但是PM2.5受其他因素的影響較大,考慮到從周圍環境的角度來建立PM2.5模型的方式,預測精度還可以有所提升。
傳統的灰色預測模型(Grey Model,GM(1,1))將時間序列數據看成一個隨時間變化的函數,但經過大量的實驗表明經典灰色模型缺乏一定的預測穩定性,即使時間序列為純指數序列,在做長期預測時仍存在較大的偏差[11-12]。基於這個原因,謝乃明等人提出離散灰色預測模型(Discrete Grey Forecasting Model,DGM(1,1)),並經過實驗表明,DGM(1,1)相較於傳統的GM(1,1)模型即使在時間序列數據大致符合指數增長規律也具有較好的預測精度,且對於長期預測有一定的優勢[13]。
氣象因素和空氣質量因素均為典型的時間序列數據,但是分析影響PM2.5相關因素時,發現無論是氣象因素還是空氣質量因素都是震盪序列,GM(1,1)和DGM(1,1)兩種模型對於單調遞增的時間序列數據都具備一定的預測精度,而對於震盪序列的預測精度則不能夠確定。王巖、黃張裕等人提出一種基於震盪序列的灰色預測模型(Stochastic Discrete Grey Forecasting Model,SDGM(1,1)),在進行震盪序列預測時,能夠達到比較好的精度[14]。