Sistema de Análisis de Datos Basado en Machine Learning para Identificar Patrones entre Deserción Escolar y Pobreza Multidimensional en Paraguay en el Contexto de la Informática Empresarial
Palabras clave:
Educación, Deserción escolar, Agrupamiento, Minería de datosResumen
Este estudio investiga la relación entre la tasa de deserción escolar y el índice de pobreza multidimensional en Paraguay mediante un proceso de extracción, transformación y carga (ETL), se analizaron datos del Ministerio de Educación y Ciencias (MEC) y del Instituto Nacional de Estadística (INE). La investigación emplea técnicas de agrupamiento, en particular el método K-Means, para identificar patrones y perfiles de riesgo entre los estudiantes. Los hallazgos destacan el impacto significativo de factores socioeconómicos, como la pobreza y el trabajo infantil, en las tasas de deserción escolar. Estos hallazgos buscan fundamentar intervenciones específicas para mejorar los resultados educativos y reducir las tasas de deserción escolar en Paraguay.
Referencias
World Bank Group. (s.f.). Poverty Overview. (World Bank) Recuperado el julio de 2025, de https://www.worldbank.org/en/topic/poverty/overview
Abideen, Z.U. (2023). Analysis of enrollment criteria in secondary schools using machine learning and data mining approach. Electronics, 12(3), 694.
Alkire , S., & Foster, J. (2008). Counting and Multidimensional Poverty Measurement. Oxford Poverty and Human Development Initiative (OPHI) Working Paper No. 07. Recuperado el julio de 2025, de https://ophi.org.uk/publication/WP-07/
Alkire , S., & Santos, M. E. (2010). Acute Multidimensional Poverty: A New Index for Developing Countries. OPHI Working Paper 38. Obtenido de https://ophi.org.uk/wp-content/uploads/ophi-wp38.pdf
Arthur, D. &. (2007). k-means++: The advantages of careful seeding. Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms (págs. 1027–1035). New Orleans, LA: Society for Industrial and Applied Mathematics.
CEPAL. (Noviembre de 2022). Panorama Social de América Latina 2001 - 2002. Obtenido de https://repositorio.cepal.org/server/api/core/bitstreams/596665b2-336e-41df-a0a3-d2c5fc275269/content
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2nd ed. O'Reilly Media.
Gobiernodelparaguay.gov.py. (2024). Hambre Cero en las Escuelas – Un Paraguay que cuida a los niños. Recuperado el 2025, de https://hambrecero.gobiernodelparaguay.gov.py/wp-content/uploads/2025/03/HAMBRE-CERO_INFORMACIONES-GENERALES.pdf
Heredia Mayorga, H. (2020). Big data en la educación. SciELO Bolivia.
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la investigación (6a ed. ed.). México: McGraw-Hill.
Inmon, W. H. (2005). Building the Data Warehouse (4ta. Edición ed.). Hoboken.
Instituto Nacional de Estadística (INE). (Diciembre de 2022). Índice de Pobreza Multidimensional (IPM) 2022. Asunción, Paraguay. Obtenido de https://www.ine.gov.py/publicaciones/sociales/IPM_2022.pdf
Jain, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern recognition letters.
JetBrains. (2025). PyCharm Community Edition. Obtenido de https://www.jetbrains.com/pycharm/
Kimball , R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. 3rd ed. John Wiley & Sons.
Matplotlib Development Team,. (2023). Matplotlib: Visualization with Python. Obtenido de https://matplotlib.org/
McKinney, W. (2010). Data Structures for Statistical Computing in Python. 9th Python in Science Conference, 51–56.
NumPy Developers. (2023). NumPy: The fundamental package for scientific computing with Python. Obtenido de https://numpy.org/
Organización Internacional del Trabajo (OIT). (2017). Trabajo infantil: Un problema global. Obtenido de https://www.ilo.org/es/temas-y-sectores/trabajo-infantil
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830.
Peralta, N., Misiego Telesca, P., Benítez Ayala, M., & Prieto, J. (2013). Deserción en la Educación Media. Revista Científica Estudios e Investigaciones.
Psacharopoulos, G. (1997). Child labor versus educational attainment: Some evidence from Latin America. Journal of Population Economics, 10(4), 377–386.
Reyes, G.E., Sosa, D.V., Quispe, M.G., Iraola-Real, I. (2021). Family, economic and pedagogical factors involved in dropping out of school and the consequences for students of a private institution in Lima-Peru. 2021 IEEE Sciences and Humanities International Research Conference (SHIRCON), pp. 1–4.
Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53–65.
Sabino, C. (2017). La Historia y su Método: Guía para Estudiantes y Estudiosos de la Historia. Unión Editorial.
Seaborn Developers. (2025). Seaborn: Statistical data visualization. Obtenido de https://seaborn.pydata.org/
Tan, , P. N., Steinbach, M., & Kumar, V. (2019). Introduction to Data Mining. 2nd ed. Pearson.
Tejada Escobar, F., Murrieta Marcillo, R., Villao Santos, F., & Garzón Balcázar, J. (2018). Big Data en la Educación: Beneficios e Impacto de la Analítica de Datos. SciELO Ecuador.
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2025 Diego Rubén Insfrán Coronel, Enzo Marcel Enrique Sanchez

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.