Diseño, implementación y validación de un Laboratorio Universitario de Análisis de Datos basado en técnicas de modelamiento matemático y estadística aplicada.
Development and evaluation of advanced statistical methodologies and tools for solving complex problems in the academic and professional field.
DOI:
https://doi.org/10.37117/s.v28i1.1272Palavras-chave:
Análisis de datos, Modelamiento matemático, Educación superior, Software de código abierto, Laboratorio universitario, Matemáticas aplicadas, Infraestructura educativa, Aprendizaje basado en proyectos.Resumo
Se propone el diseño de un Laboratorio Universitario de Análisis de Datos orientado a fortalecer la formación en modelamiento matemático y estadística aplicada en carreras de Matemáticas Aplicadas. El modelo se basa en una infraestructura local de ocho estaciones de trabajo y un nodo maestro, interconectadas mediante un switch gestionable, y utiliza exclusivamente software de código abierto como Python, R, Hadoop, Spark, Hive y Power BI para simular un entorno de cómputo distribuido sin depender de servicios en la nube ni licencias comerciales. El diseño integra el ciclo completo del análisis de datos: desde la carga y limpieza hasta la visualización e interpretación de resultados, alineándose con las necesidades de formación en ciencia de datos en contextos universitarios con recursos limitados. Aunque el laboratorio no ha sido implementado ni evaluado empíricamente, su estructura responde a principios de accesibilidad, reproducibilidad y escalabilidad progresiva, ofreciendo un marco técnico-pedagógico viable para su futura implementación en instituciones de educación superior. El enfoque busca cerrar la brecha entre la teoría matemática y la práctica analítica, promoviendo competencias técnicas y cognitivas esenciales para el análisis cuantitativo contemporáneo.
Downloads
Referências
Apache Software Foundation. (2020). Apache Ambari Documentation. Obtenido de https://ambari.apache.org/
Braun, V., & Clarke, V. (2006). Using thematic analysis in psychology. Qualitative Research in Psychology, 3, 77–101. Obtenido de https://doi.org/10.1191/1478088706qp063oa
Camacho Marín, R., Rivas Vallejo, C., Gaspar Castro, M., & Quiñonez Mendoza, C. (2020). Innovación y tecnología educativa en el contexto actual latinoamericano. Revista de Ciencias Sociales, 26, 460-472. Obtenido de https://www.redalyc.org/journal/280/28064146030/html/
CISCO. (2023). Cisco SG200-18 Smart Switch Data Sheet. Cisco. Obtenido de https://www.cisco.com/c/es_mx/obsolete/switches/cisco-small-business-200-series-smart-switches.html
Dean, J., & Ghemawat, S. (2008). MapReduce: Simplified data processing on large clusters. Communications of the ACM, 51, 107–113. Obtenido de https://doi.org/10.1145/1327452.1327492
Hassin Alasadi, A. H., & Nemer, Z. N. (2017). Finger Vein Verification System based on Three Methodologies of Feature Extraction. International Journal of Computer Applications, 172(5), 0975 – 8887. doi:https://doi.org/10.5120/ijca2017915144
Kolokolov, A., & Zelensky, M. (2024). Data Visualization with Microsoft Power BI: How to Design Savvy Dashboards. Sebastopol, California: O'Reilly Media.
Márquez Silva, F., & López Martínez2, R. (2025). Competencias investigativas y su análisis en el campo de la tecnología educativa mediante e-learning. Revista Ensayos Pedagógicos, 20(1), 1-37. doi:http://doi.org/10.15359/rep.20-1.7
McKinney, W. (2010). Data structures for statistical computing in Python. Proceedings of the 9th Python in Science Conference, (págs. 51–56). Obtenido de https://doi.org/10.25080/Majora-92bf1922-00a
O’Neil, C., & Schutt, R. (2013). Doing data science: Straight talk from the frontline. O’Reilly Media.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., & Thirion, B. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 2825–2830. Obtenido de https://doi.org/10.48550/arXiv.1201.0490
Pinto Ayala, B. E., Castañeda Fuentes, J. G., & Sojos Tubay, A. M. (2024). Competencias digitales en docentes latinoamericanos de educación primaria en los años del 2018-2022. Revista de Ciencias Humanísticas y Sociales, 49-59. doi:https://doi.org/10.33936/rehuso.v9i1.5773
Sumbaly, R., Kreps, J., & Wu, L. (2012). The “big data” ecosystem at LinkedIn. ACM SIGMOD International Conference on Management of Data, (págs. 1125–1128). Obtenido de https://doi.org/10.1145/2213836.2213957
Tanenbaum, A., & Wetherall, D. (2011). Computer networks (5th ed.). Pearson Education.
White, T. (2015). Hadoop: The definitive guide (4th ed.). O’Reilly Media.
Wickham, H. (2016). ggplot2: Elegant graphics for data analysis (2nd ed.). Springer. Obtenido de https://doi.org/10.1007/978-3-319-24277-4
Yin, R. (2014). Case study research: Design and methods (5th ed.). SAGE Publications.
Zhang, Q., Cheng, L., & Boutaba, R. (2010). Cloud computing: State-of-the-art and research challenges. Journal of Internet Services and Applications, 1, 7–18. Obtenido de https://doi.org/10.1007/s13174-010-0007-6
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2026 Jefferson Agustín Macías Bravo, Wilson Fabián Chávez Rodríguez, Yandri Francinet Guerrero Alcívar

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
El Copyright posee el propósito de proteger tanto la propiedad intelectual de los autores como sus resultados. El comité editorial de la Revista Sinapsis se compromete con los autores a proteger, defender y preservar tanto su trabajo como su reputación, y toma muy en serio las acusaciones de infracción, plagio, disputas éticas y fraude. Si un autor se da cuenta de un posible plagio, copia de resultados, fraude o infracción, le rogamos que se comunique con la mayor brevedad posible con el comité editorial de la revista Sinapsis.
CC BY-NC-ND: esta licencia permite a los reutilizadores copiar y distribuir el material en cualquier medio o formato solo sin adaptarlo, solo con fines no comerciales y siempre que se le atribuya al creador.
Términos de Licencia:
Reconocimiento: debe otorgar el crédito correspondiente, proporcionar un enlace a la licencia e indicar si se realizaron cambios. Puede hacerlo de cualquier manera razonable, pero no de ninguna manera que sugiera que el licenciante lo respalda a usted o su uso.
No comercial: no puede utilizar el material con fines comerciales.
No Derivada: si remezcla, transforma o construye sobre el material, no puede distribuir el material modificado.
Sin restricciones adicionales: no puede aplicar términos legales o medidas tecnológicas que restrinjan legalmente a otros de hacer cualquier cosa que permita la licencia.
El autor esta en la obligación de seguir las exigencias según lo instruido en la licencia ubicada en el enlace: https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es



