Clasificación de la calidad del agua en Los Ríos de Morona Santiago utilizando aprendizaje automático
Resumen
Este estudio presenta una metodología basada en el preprocesamiento de datos fisicoquímicos y el uso de algoritmos de aprendizaje automático para clasificar la calidad del agua superficial en la red hidrográfica de Morona Santiago, Ecuador. Los datos fueron recolectados del proyecto de vinculación “Sistema de Información Geográfica para el Monitoreo de la Calidad del Agua”, e incluyeron 2.091 registros con parámetros como pH, DBO5, oxígeno disuelto, nitratos y coliformes fecales. Se aplicaron técnicas de limpieza, transformación y normalización de datos, y se entrenaron dos modelos supervisados: Random Forest y Red Neuronal Artificial. Los resultados mostraron un alto rendimiento de ambos modelos (accuracy > 87 %), siendo la Red Neuronal la más precisa (F1-score = 0.8675). Además, se identificó que la DBO5 y los coliformes fecales son los atributos más influyentes. Los mapas temáticos generados permiten visualizar espacialmente las zonas críticas de calidad de agua. Esta investigación valida el uso del aprendizaje automático como herramienta eficaz para fortalecer los sistemas de monitoreo ambiental en territorios amazónicos.
Palabras clave
Referencias
Ahmed, M. U., Rauf, H. T., Lali, M. I. U., & Khan, M. A. (2021). A machine learning framework for water quality prediction using deep learning models. IEEE Access, 9, 79304–79317. https://doi.org/10.1109/ACCESS.2021.3084200
Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 785–794). https://doi.org/10.1145/2939672.2939785
Gholami, A., Banejad, H., & Nazari, S. (2020). Water quality classification using machine learning models: A case study. Environmental Monitoring and Assessment, 192(4), 1–17. https://doi.org/10.1007/s10661-020-08216-4
Guyon, I., & Elisseeff, A. (2003). An introduction to variable and feature selection. Journal of Machine Learning Research, 3, 1157–1182. http://www.jmlr.org/papers/volume3/guyon03a/guyon03a.pdf
Jerez, J. M., Molina, I., García-Laencina, P. J., Alba, E., Ribelles, N., Martín, M., & Franco, L. (2010). Missing data imputation using statistical and machine learning methods in a real breast cancer problem. Artificial Intelligence in Medicine, 50(2), 105–115. https://doi.org/10.1016/j.artmed.2010.05.002
Kotsiantis, S., Kanellopoulos, D., & Pintelas, P. (2006). Data preprocessing for supervised leaning. International Journal of Computer Science, 1(2), 111–117. https://arxiv.org/abs/2007.06044
Liu, H., et al. (2023). Integrated approach to assess river water quality using data preprocessing and ensemble machine learning. Environmental Research, 224, 115504. https://doi.org/10.1016/j.envres.2023.115504
MAATE. (2022). Informe de calidad ambiental hídrica 2022. Ministerio del Ambiente, Agua y Transición Ecológica del Ecuador. https://ambiente.gob.ec/informes-de-calidad-ambiental-hidrica/
Organización Mundial de la Salud (OMS). (2017). Directrices para la calidad del agua potable (4.ª ed.). OMS. https://www.who.int/publications/i/item/9789241549950
Pourghasemi, H. R., & Gayen, A. (2020). Water quality index prediction using ensemble machine learning algorithms. Science of the Total Environment, 731, 139211. https://doi.org/10.1016/j.scitotenv.2020.139211
Qi, Y., & Wu, J. (2023). Assessment of classification models for monitoring river pollution. Water Research, 239, 120011. https://doi.org/10.1016/j.watres.2023.120011
Rodríguez-Pérez, R., Muñoz-Tapia, M., & Andrade, M. (2020). Diagnóstico de la calidad de agua superficial de los ríos ecuatorianos. Revista Politécnica, 45(1), 77–89. https://revistapolitecnica.epn.edu.ec/index.php/revista_politecnica/article/view/1221
WHO. (2017). Guidelines for drinking-water quality (4th ed.). World Health Organization. https://www.who.int/publications/i/item/9789241549950
Zhang, Y., Wang, Y., & Zhuang, X. (2022). Comparative analysis of ML algorithms in classifying water quality. Environmental Pollution, 297, 118741. https://doi.org/10.1016/j.envpol.2021.118741
Adhikari, B. R., & Shrestha, N. (2020). Assessment of surface water quality using water quality index and multivariate statistical techniques in Bagmati River, Nepal. Environmental Challenges, 1, 100003. https://doi.org/10.1016/j.envc.2020.100003
Bhardwaj, S. K., & Poonia, R. C. (2021). A machine learning-based approach for predicting water quality index using ensemble learning. Environmental Science and Pollution Research, 28(19), 23891–23903. https://doi.org/10.1007/s11356-020-11623-3
Ren, X., Liu, X., & Lin, M. (2022). A hybrid machine learning model for water quality classification based on SVM and PCA. Environmental Monitoring and Assessment, 194, 799. https://doi.org/10.1007/s10661-022-10337-y
Chen, K., Lu, W., Wu, W., & Zhou, L. (2023). A spatiotemporal analysis of river water quality using deep learning and satellite data. Science of the Total Environment, 858, 159847. https://doi.org/10.1016/j.scitotenv.2022.159847
Hossain, M. S., Chowdhury, M. A. M., & Rahman, M. M. (2019). Water quality classification using artificial neural network and support vector machine: A case study of the Buriganga River, Bangladesh. Sustainable Water Resources Management, 5, 1347–1355. https://doi.org/10.1007/s40899-019-00315-3.
DOI: https://doi.org/10.23857/pc.v10i7.9999
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/