Sistema de Análisis de Datos Basado en Machine Learning para Identificar Patrones entre Deserción Escolar y Pobreza Multidimensional en Paraguay en el Contexto de la Informática Empresarial

Autores/as

Palabras clave:

Educación, Deserción escolar, Agrupamiento, Minería de datos

Resumen

Este estudio investiga la relación entre la tasa de deserción escolar y el índice de pobreza multidimensional en Paraguay mediante un proceso de extracción, transformación y carga (ETL), se analizaron datos del Ministerio de Educación y Ciencias (MEC) y del Instituto Nacional de Estadística (INE). La investigación emplea técnicas de agrupamiento, en particular el método K-Means, para identificar patrones y perfiles de riesgo entre los estudiantes. Los hallazgos destacan el impacto significativo de factores socioeconómicos, como la pobreza y el trabajo infantil, en las tasas de deserción escolar. Estos hallazgos buscan fundamentar intervenciones específicas para mejorar los resultados educativos y reducir las tasas de deserción escolar en Paraguay.

Referencias

World Bank Group. (s.f.). Poverty Overview. (World Bank) Recuperado el julio de 2025, de https://www.worldbank.org/en/topic/poverty/overview

Abideen, Z.U. (2023). Analysis of enrollment criteria in secondary schools using machine learning and data mining approach. Electronics, 12(3), 694.

Alkire , S., & Foster, J. (2008). Counting and Multidimensional Poverty Measurement. Oxford Poverty and Human Development Initiative (OPHI) Working Paper No. 07. Recuperado el julio de 2025, de https://ophi.org.uk/publication/WP-07/

Alkire , S., & Santos, M. E. (2010). Acute Multidimensional Poverty: A New Index for Developing Countries. OPHI Working Paper 38. Obtenido de https://ophi.org.uk/wp-content/uploads/ophi-wp38.pdf

Arthur, D. &. (2007). k-means++: The advantages of careful seeding. Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms (págs. 1027–1035). New Orleans, LA: Society for Industrial and Applied Mathematics.

CEPAL. (Noviembre de 2022). Panorama Social de América Latina 2001 - 2002. Obtenido de https://repositorio.cepal.org/server/api/core/bitstreams/596665b2-336e-41df-a0a3-d2c5fc275269/content

Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 2nd ed. O'Reilly Media.

Gobiernodelparaguay.gov.py. (2024). Hambre Cero en las Escuelas – Un Paraguay que cuida a los niños. Recuperado el 2025, de https://hambrecero.gobiernodelparaguay.gov.py/wp-content/uploads/2025/03/HAMBRE-CERO_INFORMACIONES-GENERALES.pdf

Heredia Mayorga, H. (2020). Big data en la educación. SciELO Bolivia.

Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la investigación (6a ed. ed.). México: McGraw-Hill.

Inmon, W. H. (2005). Building the Data Warehouse (4ta. Edición ed.). Hoboken.

Instituto Nacional de Estadística (INE). (Diciembre de 2022). Índice de Pobreza Multidimensional (IPM) 2022. Asunción, Paraguay. Obtenido de https://www.ine.gov.py/publicaciones/sociales/IPM_2022.pdf

Jain, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern recognition letters.

JetBrains. (2025). PyCharm Community Edition. Obtenido de https://www.jetbrains.com/pycharm/

Kimball , R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. 3rd ed. John Wiley & Sons.

Matplotlib Development Team,. (2023). Matplotlib: Visualization with Python. Obtenido de https://matplotlib.org/

McKinney, W. (2010). Data Structures for Statistical Computing in Python. 9th Python in Science Conference, 51–56.

NumPy Developers. (2023). NumPy: The fundamental package for scientific computing with Python. Obtenido de https://numpy.org/

Organización Internacional del Trabajo (OIT). (2017). Trabajo infantil: Un problema global. Obtenido de https://www.ilo.org/es/temas-y-sectores/trabajo-infantil

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830.

Peralta, N., Misiego Telesca, P., Benítez Ayala, M., & Prieto, J. (2013). Deserción en la Educación Media. Revista Científica Estudios e Investigaciones.

Psacharopoulos, G. (1997). Child labor versus educational attainment: Some evidence from Latin America. Journal of Population Economics, 10(4), 377–386.

Reyes, G.E., Sosa, D.V., Quispe, M.G., Iraola-Real, I. (2021). Family, economic and pedagogical factors involved in dropping out of school and the consequences for students of a private institution in Lima-Peru. 2021 IEEE Sciences and Humanities International Research Conference (SHIRCON), pp. 1–4.

Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53–65.

Sabino, C. (2017). La Historia y su Método: Guía para Estudiantes y Estudiosos de la Historia. Unión Editorial.

Seaborn Developers. (2025). Seaborn: Statistical data visualization. Obtenido de https://seaborn.pydata.org/

Tan, , P. N., Steinbach, M., & Kumar, V. (2019). Introduction to Data Mining. 2nd ed. Pearson.

Tejada Escobar, F., Murrieta Marcillo, R., Villao Santos, F., & Garzón Balcázar, J. (2018). Big Data en la Educación: Beneficios e Impacto de la Analítica de Datos. SciELO Ecuador.

Descargas

Publicado

14-12-2025

Cómo citar

Sistema de Análisis de Datos Basado en Machine Learning para Identificar Patrones entre Deserción Escolar y Pobreza Multidimensional en Paraguay en el Contexto de la Informática Empresarial. (2025). Revista Científica Multidisciplinaria Tajy - ISSN: 3105-059X, 2(1), 73-85. https://revistas.unc.edu.py/index.php/fcea/article/view/420