Uczenie maszynowe w prognozowaniu ilości ścieków dla oczyszczalni ścieków miasta Rzeszowa na podstawie warunków pogodowych

Streszczenie
Parametry oczyszczalni ścieków w Polsce muszą spełniać określone normy, które regulują jakość odpływu po procesie oczyszczania. Ilość oraz jakość dopływających ścieków zależy od wielu czynników, między innymi od warunków pogodowych. Prognozowanie tych parametrów pozwala zapewnić optymalną pracę oczyszczalni, co przyczynia się do redukcji kosztów ich pracy. W tym celu, korzystając z danych pogodowych, przeprowadzono próbę oszacowania ilości ścieków dopływających do oczyszczalni w Rzeszowie. Wykorzystano ponad 1000 modeli uczenia maszynowego (ML), w tym także modele statystyczne, takie jak ARIMA i SARIMAX, oraz algorytmy ML, takie jak KNN i sieci neuronowe, w różnych konfiguracjach i przedziałach czasowych. Uzyskano najmniejszy średni błąd bezwzględny (MAE) na poziomie 3598 m3 oraz błąd średniokwadratowy (RMSE) równe 4808 m3. Badanie pokazało, jak wybór parametrów oraz różnych typów modeli predykcyjnych (statycznych, dynamicznych, uczenia maszynowego) wpływa na dokładność prognoz, co bazując wyłącznie na podstawowych danych czasowych, okazuje się być wymagającym procesem.
Słowa kluczowe
oczyszczalnia ścieków, sieci neuronowe, systemy sterowania, uczenie maszynowe
Machine Learning in Forecasting the Amount of Sewage for the Wastewater Treatment Plant of the City of Rzeszów Based on Weather Conditions
Abstract
The parameters of wastewater treatment plants in Poland must meet certain standards that regulate the quality of wastewater after the treatment process. The quantity and quality of incoming sewage depend on many factors, including weather conditions. Forecasting these parameters can ensure optimal operation of the treatment plant, which will reduce operating costs. For this purpose, using weather data, an attempt was made to estimate the amount of sewage flowing into the sewage treatment plant in Rzeszow. Over 1000 machine learning (ML) models were used, including statistical models such as ARIMA and SARIMAX, and ML algorithms such as KNN and neural networks, in various configurations and time frames. The lowest mean absolute error (MAE) of 3598 m3 and the root mean square error (RMSE) of 4808 m3 were obtained. The study showed how the selection of parameters and different types of predictive models (static, dynamic, machine learning) affects forecast accuracy. It also highlighted that forecasting based solely on basic time-series data is a challenging process.
Keywords
control systems, machine learning, neural networks, wastewater treatment plant
Bibliografia
- Kılıç Z., The importance of water and conscious use of water, “International Journal of Hydrology”, Vol. 4, No. 5, 2020, 239–241, DOI: 10.15406/ijh.2020.04.00250.
- Małecki Z.J., Gołębiak P., Zasoby wodne polski i świata, „Zeszyty Naukowe. Inżynieria Lądowa I Wodna w Kształtowaniu Środowiska”, Nr 7, 2012, 50–56.
- Jackson R.B., Carpenter S.R., Dahm C.N., et al., Water in a changing world, “Ecological applications”, Vol. 11, No. 4, 2001, 1027–1045, DOI: 10.1890/1051-0761(2001)011[1027:WIACW]2.0.CO;2.
- Masłoń A., Tomaszek J.A., Ocena efektywności oczyszczalni ścieków w Lubaczowie, „Czasopismo Inżynierii Lądowej, Środowiska i Architektury”, Z. 60, Nr 3, 2013, 209–222.
- Organiściak P., Masłoń A.A., Kowal B., et al., Machine learning-based prediction of biogas production from sludge characteristics in four anaerobic digesters-development of the AD2biogas prediction tool, “Advances in Science and Technology Research Journal”, Vol. 18, No. 8, 2024, 1–15, DOI: 10.12913/22998624/192936.
- Dziopak J., Starzec M., Wpływ kierunku i prędkości przemieszczania się opadu deszczu na maksymalne szczytowe przepływy ścieków w sieci kanalizacyjnej, „Czasopismo Inżynierii Lądowej, Środowiska i Architektury”, Z. 61, Nr 3, 2014, 63–81.
- Skoczko I., Ofman P., Szatyłowicz E., Zastosowanie sztucznych sieci neuronowych do modelowania procesu oczyszczania ścieków w małej oczyszczalni ścieków, „Rocznik Ochrona Środowiska”, tom 18, cz. 1, 2016, 493–506.
- Bogusz M., Matysik-Pejas R., Krasnodębski A., et al., The concept of zero waste in the context of supporting environmental protection by consumers, “Energies”, Vol. 14, No. 18, 2021, DOI: 10.3390/en14185964.
- Okoffo E.D., O’Brien S., O’Brien J.W., et al., Wastewater treatment plants as a source of plastics in the environment: a review of occurrence, methods for identification, quantification and fate, “Environmental Science: Water Research & Technology”, Vol. 5, No. 11, 2019, 1908–1931, DOI: 10.1039/C9EW00428A.
- Masłoń A., Dynamika dopływu ścieków do oczyszczalni w aspekcie funkcjonowania sekwencyjnych reaktorów porcjowych, „Instal”, Nr 10, 2017, 57–62.
- Kuraś P., Strzalka D., Kowal B., et al., REDUCE – a python module for reducing inconsistency in pairwise comparison matrices, “Advances in Science and Technology. Research Journal”, Vol. 17, No. 4, 2023, 227–234, DOI: 10.12913/22998624/170187.
- Andraka D., Dzienis L., Modelowanie ryzyka w eksploatacji oczyszczalni ścieków, „Rocznik Ochrona Środowiska”, t. 15, cz. 2, 2013, 1111–1125.
- Deublein D., Steinhauser A., Biogas from waste and renewable resources: an introduction, John Wiley & Sons, 2011.
- Maj K., Masłoń A., Wieloparametryczna ocena efektywności oczyszczalni ścieków w Rzeszowie przed modernizacją, „Czasopismo Inżynierii Lądowej, Środowiska i Architektury”, Z. 62, Nr 1, 2015, 299–315, DOI: 10.7862/rb.2015.20.
- Sadecka Z., Płuciennik-Koropczuk E., Frakcje ChZT ścieków w mechaniczno-biologicznej oczyszczalni, „Rocznik Ochrona Środowiska”, tom 13, 2011, 1157–1172.
- Szpindor A. Łomotowski J., Nowoczesne systemy oczyszczania ścieków, Wydawnictwo Arkady, Warszawa 2002.
- Szeląg B., Studziński J., Chmielowski K., Leśniańska A., Rojek I., Prognozowanie ilości ścieków dopływających do oczyszczalni za pomocą sztucznych sieci neuronowych z wykorzystaniem liniowej analizy dyskryminacyjnej, „Ochrona Środowiska”, Vol. 40, No. 4, 2018, 9–14.
- Bugajski P., Chmielowski K., Kaczor G., Wpływ wielkości dopływu wód opadowych na skład ścieków surowych w małym systemie kanalizacyjnym, „Acta Scientiarum Polonorum. Formatio Circumiectus”,Vol. 15, No. 2, 2016, 3–11, DOI: 10.15576/ASP.FC/2016.15.2.3.
- Bartkiewicz L., Szeląg B., Studziński J., Ocena wpływu zmiennych wejściowych i struktury modelu sztucznej sieci neuronowej na prognozowanie dopływu ścieków komunalnych do oczyszczalni, „Ochrona Środowiska”, Vol. 38, No. 2, 2016, 29–36.
- Zhou Z.-H., Machine learning, Springer Nature, 2021.
- Bąk Ł., Górski J., Górska K., Szeląg B., Zawartość zawiesin i metali ciężkich w wybranych falach ścieków deszczowych w zlewni miejskiej, „Ochrona Środowiska”, Vol. 34, No. 2, 2012, 49–52.
- Ociepa E., Ocena zanieczyszczenia ścieków deszczowych trafiających do systemów kanalizacyjnych, „Inżynieria i Ochrona Środowiska”, Vol. 14, No. 4, 2011, 357–364.
- Chai T., Draxler R.R., Root mean square error (RMSE) or mean absolute error (MAE), “Geoscientific model development discussions”, Vol. 7, 2014, 1525–1534, DOI: 10.5194/gmdd-7-1525-2014.
- Hurst H.E., Long-term storage capacity of reservoirs, “Transactions of the American Society of Civil Engineers”, Vol. 116, No. 1, 1951, 770–799, DOI: 10.1061/TACEAT.0006518.
- Musbah H., Aly H., Little T., A proposed novel adaptive dc technique for non-stationary data removal, “Heliyon”, Vol. 9, No. 3, 2023, DOI: 10.1016/j.heliyon.2023.e13903.
- Ghysels E., Osborn D.R., Rodrigues P.M., Chapter 13 Forecasting seasonal time series, “Handbook of Economic Forecasting”, Vol. 1, 2006, 659–711, DOI: 10.1016/S1574-0706(05)01013-X.
- Quinlan J.R., Induction of decision trees, “Machine learning”, Vol. 1, 1986, 81–106, DOI: 10.1007/BF00116251.
- Fix E., Hodges J.L., Discriminatory Analysis. Nonparametric Discrimination: Consistency Properties, “International Statistical Review/Revue Internationale de Statistique”, Vol. 57, No. 3, 1989, 238–247, DOI: 10.2307/1403797.
- Taud H., Mas J., Multilayer perceptron (MLP), “Geomatic approaches for modeling land change scenarios”, 2018, 451–455.
- Ho T.K., Random decision forests, [In:] Proceedings of 3rd International Conference on Document Analysis and Recognition, 1995, 278–282, DOI: 10.1109/ICDAR.1995.598994.
- Dubey A.K., Kumar A., García-Díaz V., et al., Study and analysis of SARIMA and LSTM in forecasting time series data, “Sustainable Energy Technologies and Assessments”, Vol. 47, 2021, DOI: 10.1016/j.seta.2021.101474.