Pi 001352
Pi 001352
Pi 001352
PROYECTO DE INVESTIGACIÓN
AUTORAS:
Masabanda Yépez Jhenny Flor
Zapata Rocha Carla Jhoana
TUTORA:
Ing. MSc. Albán Taipe Mayra Susana
LATACUNGA – ECUADOR
Agosto 2019
i
DECLARACIÓN DE AUTORÍA
ii
AVAL DEL TUTOR DEL PROYECTO DE TITULACIÓN
iii
APROBACIÓN DEL TRIBUNAL DE TITULACIÓN
iv
AGRADECIMIENTO
Jhenny
v
AGRADECIMIENTO
Carla
vi
DEDICATORIA
Jhenny
vii
DEDICATORIA
Carla
viii
ÍNDICE GENERAL
AGRADECIMIENTO.............................................................................................................................. v
RESUMEN............................................................................................................................................xvi
5 OBJETIVOS: ................................................................................................................................... 5
DataSet .......................................................................................................................... 27
Excel .............................................................................................................................. 27
8 HIPÓTESIS .................................................................................................................................... 28
Técnicas de investigación.............................................................................................. 29
x
11 IMPACTOS (INSTITUCIONALES, SOCIALES, AMBIENTALES O ECONÓMICOS) .......... 75
14 BIBLIOGRAFÍA ............................................................................................................................ 79
15 ANEXOS........................................................................................................................................ 87
xi
ÍNDICE DE TABLAS
Tabla 1: Actividades de los objetivos .................................................................................................... 6
Tabla 2: Lista de variables planteadas por Bean 1980 ......................................................................... 12
Tabla 3: Cuadro comparativo de las metodologías de minería de datos .............................................. 23
Tabla 4: Descripción de Variables ....................................................................................................... 28
Tabla 5: Carreras de la Facultad de Ciencias de la Ingeniería y Aplicadas ......................................... 30
Tabla 6: Resultados de la evaluación de la escala de Likert ................................................................ 36
Tabla 7: Resultados de validez de la encuesta ..................................................................................... 37
Tabla 8: Estadísticas descriptivas de Ciencias de Ingeniería y Aplicadas ........................................... 37
Tabla 9: Variables (x, y)....................................................................................................................... 41
Tabla 10: Descripción de los factores de deserción estudiantil............................................................ 43
Tabla 11: Estimación del modelo inicial .............................................................................................. 44
Tabla 12: Modelo con todas variables ................................................................................................. 44
Tabla 13: Modelo ajustado de factores de deserción estudiantil .......................................................... 46
Tabla 14: Los resultados del proceso de la regresión lineal ................................................................. 49
Tabla 15: Método: BestFirst - Atributo: CfsSubsetEval ...................................................................... 55
Tabla 16: Método: GreedyStepwise - Atributo: CfsSubsetEval .......................................................... 56
Tabla 17: Factores de deserción ........................................................................................................... 56
Tabla 18: Especificaciones del Multilayer Perceptrón ......................................................................... 61
Tabla 19: Resultado de la herramienta que utiliza Weka que es Multilayer Perceptron ...................... 62
Tabla 20: Especificaciones del Navie Bayes........................................................................................ 63
Tabla 21: Resultado de la herramienta que utiliza Weka que es Naive Bayes..................................... 64
Tabla 22: Resultado de la herramienta que utiliza Weka que es J48 ................................................... 65
Tabla 23: Especificaciones del J48 ...................................................................................................... 67
Tabla 24: Resultado de la herramienta que utiliza Weka que es Random Forest ................................ 68
Tabla 25: Especificaciones del Random Forest ................................................................................... 69
Tabla 26: Resultado de la herramienta que utiliza Weka que es SMO ................................................ 70
Tabla 27: Especificaciones del SMO ................................................................................................... 71
Tabla 28: Instancias clasificadas por técnicas de minería de datos ...................................................... 72
Tabla 29: Resultados de las técnicas de minería de datos que posee Weka ......................................... 72
Tabla 30: Descripción gastos directos.................................................................................................. 76
Tabla 31: Descripción gastos indirectos .............................................................................................. 76
Tabla 32: Total, Gastos Directos e Indirectos ...................................................................................... 76
xii
ÍNDICE DE FIGURAS
Figura 1: Modelo de Fishbein y Ajzen, 1975......................................................................................... 9
Figura 2: Modelo de Ethington, 1990 .................................................................................................. 10
Figura 3: El modelo de Spady, 1970 .................................................................................................... 11
Figura 4: Modelo de Tinto, 1987, Adaptado de Tinto (1975).............................................................. 11
Figura 5: Modelo de Bean, 1985.......................................................................................................... 13
Figura 6: Modelo de Pascarella y Terenzini ........................................................................................ 13
Figura 7: Pasos que componen la metodología KDD .......................................................................... 23
Figura 8: Familias técnicas en preparación de datos............................................................................ 24
Figura 9: Familias técnicas en reducción de datos ............................................................................... 25
Figura 10: Diseño de la investigación para determinar factores de deserción ..................................... 34
Figura 11: Modelo conceptual ............................................................................................................. 40
Figura 12: Ecuación generada .............................................................................................................. 42
Figura 13: Residuos del modelo con la variable 16 ............................................................................. 47
Figura 14: Continuidad del residuo del modelo ................................................................................... 47
Figura 15: Probabilidad Jarque-Bera ................................................................................................... 48
Figura 16: Regresión lineal .................................................................................................................. 51
Figura 17: Estructura gráfica de un modelo Naive Bayes ................................................................... 59
Figura 18: Árbol de decisión................................................................................................................ 65
Figura 19: ThresholdCurve con 1 - Naive Bayes ................................................................................. 73
Figura 20: ThresholdCurve con 1 - J48 ............................................................................................... 73
Figura 21: ThresholdCurve con 1 - SMO ............................................................................................ 73
Figura 22: ThresholdCurve con 1 – RandomForest ............................................................................. 73
Figura 23: ThresholdCurve con 1 – Multilayer Perceptrón ................................................................. 74
Figura 24: CostCurve con 1 - Naive Bayes.......................................................................................... 74
Figura 25: CostCurve con 1 - J48 ........................................................................................................ 74
Figura 26: CostCurve con 1 – SMO .................................................................................................... 74
Figura 27: CostCurve con 1 – RandomForest...................................................................................... 74
Figura 28: CostCurve con 1 – Multilayer Perceptrón .......................................................................... 75
Figura 29: Género de los estudiantes ................................................................................................. 100
Figura 30: Figura 27: Edad de los encuestados.................................................................................. 100
Figura 31: Carreras de Ciencias de la Ingeniería y Aplicadas ........................................................... 101
Figura 32: Ciclos al que pertenece los estudiantes ............................................................................ 102
Figura 33: Estado civil de los estudiantes .......................................................................................... 102
Figura 34: Etnia de los estudiantes .................................................................................................... 103
Figura 35: Posee discapacidad ........................................................................................................... 104
xiii
Figura 36: Tipo de discapacidad de posee ......................................................................................... 104
Figura 37: Grado de discapacidad que posee ..................................................................................... 105
Figura 38: Porcentaje de discapacidad que posee .............................................................................. 105
Figura 39: Porcentaje de discapacidad que posee .............................................................................. 106
Figura 40: País de origen de los estudiantes ...................................................................................... 106
Figura 41: Lugar de procedencia de los estudiantes de Eléctrica ...................................................... 107
Figura 42: Lugar de procedencia de los estudiantes de Industrial ..................................................... 108
Figura 43: Lugar de procedencia de los estudiantes de Electromecánica .......................................... 109
Figura 44: Lugar de procedencia de los estudiantes de Electromecánica .......................................... 110
Figura 45: Lugar de residencia actual de los estudiantes de Eléctrica ............................................... 111
Figura 46: Lugar de residencia actual de los estudiantes de Industrial .............................................. 111
Figura 47: Lugar de residencia actual de los estudiantes de Electromecánica................................... 112
Figura 48: Lugar de residencia de los estudiantes de Sistemas de Información ................................ 113
Figura 49: Estatus social de los estudiantes ....................................................................................... 113
Figura 50: Vive cerca de la universidad............................................................................................. 114
Figura 51: Tipo de hogar de los estudiantes ...................................................................................... 115
Figura 52: Número total del miembro de la familia del estudiante.................................................... 115
Figura 53: Tipo de vivienda en la que reside ..................................................................................... 116
Figura 54: Ingresos familiares mensuales .......................................................................................... 116
Figura 55: Origen de recursos de los estudios ................................................................................... 117
Figura 56: Horas que se dedican a trabajar ........................................................................................ 118
Figura 57: Nivel de formación del padre ........................................................................................... 118
Figura 58: Nivel de formación de la madre ....................................................................................... 119
Figura 59: Colegio del que proceden ................................................................................................. 120
Figura 60: Elección de carrera ........................................................................................................... 120
Figura 61: Proceso de formación académica ..................................................................................... 121
Figura 62: Proceso de nivelación ....................................................................................................... 122
Figura 63: Expectativas de la carrera ................................................................................................. 122
Figura 64: Expectativas de la carrera ................................................................................................. 123
Figura 65: Comportamiento negativo de docentes en el aula de clases ............................................. 124
Figura 66: Comportamiento negativo de docentes en el aula de clases ............................................. 124
Figura 67: Razones de conductas inapropiadas ................................................................................. 125
Figura 68: No tener amistades ........................................................................................................... 126
Figura 69: Espacios de bienestar estudiantil adecuados .................................................................... 126
Figura 70: Bullying por parte de compañeros .................................................................................... 127
Figura 71: Bullying por parte de docentes ......................................................................................... 128
xiv
Figura 72: Expectativas profesionales planeadas............................................................................... 128
Figura 73: Abandonar la universidad ................................................................................................. 129
Figura 74: Razones para dejar la universidad .................................................................................... 129
Figura 75: Rendimiento académico de los estudiantes ...................................................................... 130
Figura 76: Razones de bajo rendimiento académico ......................................................................... 131
Figura 77: Valoran el esfuerzo los docentes ...................................................................................... 131
Figura 78: Inadecuado sistema de tutorías ......................................................................................... 132
Figura 79: Problemas familiares ........................................................................................................ 133
Figura 80: Inadecuada formación del docente ................................................................................... 133
Figura 81: Inadecuada orientación del aprendizaje............................................................................ 134
Figura 82: Inadecuado desarrollo de cualidades humanas del docente.............................................. 135
Figura 83: Inadecuado desarrollo de cualidades humanas del docente.............................................. 135
Figura 84: Estado de gestación del estudiante planificado - no planificado ...................................... 136
Figura 85: Estado de gestación del estudiante planificado - no planificado ...................................... 137
Figura 86: Factor bullying ................................................................................................................. 138
Figura 87: Factor bullying ................................................................................................................. 138
Figura 88: Actividades que se dedica el estudiante ........................................................................... 139
Figura 89: Actividades que se dedica el estudiante ........................................................................... 140
Figura 90: Factores que impiden continuar sus estudios ................................................................... 141
Figura 91: Factores relacionados con la etapa académica ................................................................. 142
Figura 92: Estado de ánimo frente al docente .................................................................................... 143
xv
UNIVERSIDAD TÉCNICA DE COTOPAXI
FACULTAD DE CIENCIAS DE LA INGENIERÍA Y APLICADAS
TÍTULO: “MODELO BASADO EN MINERÍA DE DATOS PARA DETERMINAR
FACTORES DE DESERCIÓN ESTUDIANTIL EN LA FACULTAD DE CIENCIAS DE LA
INGENIERÍA Y APLICADAS DE LA UNIVERSIDAD TÉCNICA DE COTOPAXI”.
RESUMEN
La deserción en las universidades es considerada como el abandono de los estudiantes que
puede ser temporal o definitivo, causa efectos negativos como problemas socioeconómicos para
el estudiante y la institución que lo acogió. Por tal razón, este problema debe ser tratado a
profundidad para establecer estrategias que permitan minimizar las tasas de deserción en las
universidades y la culminación exitosa de los estudios universitarios. La revisión de la literatura
permitió determinar estudios para predecir la deserción a través de técnicas de minería de datos,
sin embargo, los estudios analizados fueron ejecutados en entornos de Educación Superior que
difieren del contexto de educación que se aplica en el Ecuador. Se propone un modelo para
determinar factores de deserción estudiantil a través de técnicas de minería de datos para
determinar factores que influyen en la deserción y su influencia predictiva. El proceso
experimental se basa en una encuesta en línea aplicada a 1457 estudiantes de la Facultad de
Ciencias de la Ingeniería y Aplicadas de las Carreras de Ingenierías: Eléctrica, Sistemas de
Información, Electromecánica e Industrial. La metodología aplicada corresponde a Knowledge
Discovery in Databases (KDD), que consta de cinco etapas: selección, pre-procesamiento,
transformación, extracción e interpretación y evaluación. Los resultados encontrados permiten
determinar que los factores: conducta en el aula de clases, bullying, motivación del docente –
alumno, limitado conocimiento de la asignatura, adicción de las redes sociales, estado
emocional, conocimiento adquirido en los cursos de nivelación, formación académica, sistema
de ingreso a la universidad, problemas familiares, residencia y expectativas respecto a la carrera
seleccionada, son los factores que tienen mayor influencia en la deserción de los estudiantes en
la Facultad de Ciencias de la Ingeniería y Aplicadas. Mientras que las técnicas de minería de
datos J48, Random Forest y Sequential Minimal Optimization (SMO), dieron como resultado
una tasa de predicción de la deserción del 92%. Se concluye que el uso de técnicas de minería
de datos puede ser consideradas como importantes para realizar estudios de las causales que
afectan a los estudiantes en su permanencia estudiantil universitaria. Además, esta herramienta
podría ser considerada como una herramienta de apoyo para las autoridades universitarias a fin
de que se establezca estrategias y políticas que permitan mitigar las tasas de deserción.
Palabras claves: deserción universitaria, factores de deserción, minería de datos, Machine
Learning.
xvi
TECHNICAL UNIVERSITY OF COTOPAXI
FACULTY OF ENGINEERING AND APPLIED SCIENCES
TITLE: "MODEL BASED ON DATA MINING TO DETERMINE STUDENT DROPOUT
FACTORS IN THE FACULTY OF SCIENCES OF THE ENGINEERING AND APPLIED
OF THE TECHNICAL UNIVERSITY OF COTOPAXI"
Authors: Masabanda Yépez Jhenny Flor
Zapata Rocha Carla Jhoana
ABSTRACT
xvii
AVAL DE TRADUCCIÓN
xviii
1
1 INFORMACIÓN GENERAL
Título del Proyecto:
Fecha de inicio:
Octubre 2018.
Fecha de finalización:
Agosto 2019.
Lugar de ejecución:
Barrio El Ejido, Parroquia Eloy Alfaro, Cantón Latacunga, Provincia de Cotopaxi, Zona 3,
Facultad de Ciencias de la Ingeniería y Aplicadas - Universidad Técnica de Cotopaxi.
Equipo de Trabajo:
Tutora de Titulación
Área de Conocimiento:
Área: Ciencias.
2
Línea de investigación:
Por tal razón, las instituciones de educación superior han empezado a trabajar en el diseño de
mecanismos y formas de asegurar el aumento de la retención en los primeros años de estudios
universitarios. Muchos estudios aplicados para predecir la deserción siguen como patrón el
modelo teórico planteado por (Vicent Tinto, 1975) en donde el autor manifiesta sobre los
indicadores de retención y persistencia, haciendo referencia a la retención como el compromiso
de la universidad y la persistencia en el esfuerzo del estudiante. De la misma manera en el
modelo de (William Spady, 1970), incorporan factores externos a los percibidos por el
individuo, con un enfoque sociológico, el autor considera factores relacionados al medio
familiar. Los factores planteados por (John Bean, 1985), corresponde a factores académicos,
psicosociales, ambientales y de socialización (Ramírez and Grandón, 2018).
Por otro lado, el modelo predictivo empleado por (Cuji, Gavilanez & Sánchez 2017) y citado
por (Ramírez & Grandón 2018) busca predecir futuros comportamientos (Ramírez & Grandón,
2018), por medio de la técnica de clasificación que corresponde a árboles de decisión
empleando el J48. El autor realizó la predicción a través del uso de variables como: el semestre
que cursan, estado civil, discapacidad física, nivel económico, edad, sexo, trabajo del padre y
la madre, notas de los exámenes, entre otros. A partir del árbol de decisión J48 de la herramienta
Waikato Environment for Knowledge Analysis (WEKA) se obtiene datos que alerta al docente
sobre los estudiantes en riesgo de desertar.
3
4 EL PROBLEMA DE INVESTIGACIÓN
La deserción estudiantil universitaria es un fenómeno que no respeta ninguna nación o
continente, aunque en diversos países los índices varían de uno a otro. De acuerdo al reporte
del Instituto Internacional para la Educación Superior en América Latina y el Caribe (IESALC),
existen cuatro factores principales que influyen en la deserción: socioeconómicos, propio
sistema universitario, orden académico y personales (Viteri Castro & Uquillas Narváez, 2011).
Con el entorno amplio de matrícula estudiantil, aparecieron las primeras investigaciones sobre
el abandono universitario en Argentina, promovidos por los sociólogos Jorge Graciarena
(1961), Gino Germani y Ruth Sautu (1965). Se dieron otras investigaciones desde otros campos
disciplinarios como la economía que sea tanto local como internacional, en el cual se vincularon
con diversas tradiciones teorías y disciplinarias (Santos Sharpe & Carli, 2016).
Por otra parte, la deserción en los estudios universitarios ha existido hace varias décadas atrás
y sigue existiendo en la actualidad, esto se ha convertido en un problema grave en el ámbito de
educación superior, debido a las altas tasas de deserción que se presenta en los estudiantes de
primer año de carrera, quienes abandonan sus estudios en un 19% de acuerdo al Ministerio de
Educación, Cultura y Deporte en España en el año 2015 (Tuero, Cervero, Esteban, & Bernardo,
2018).
abandonaron sus estudios por problemas económicos, el 25.9% por una mala elección de la
profesión a seguir, el 0.8% por problemas institucionales, el 2.1% por motivos relacionados con
el embarazo y el 0.7% por motivos de enfermedad (Gardner, Dussán, & Montoya, 2016).
Por otro lado, existe en la literatura varios factores que determinan la deserción universitaria.
Estos factores pueden estar relacionados con el hecho de que los estudiantes llegan sin
conocimientos, sin ninguna información, sin motivación y no cuentan con una planificación
para su formación profesional (Pérez Álvares & Aguilar López, 2017). Existen otras causas
comunes de deserción, entre ellas se encuentran: las económicas, familiares o una mala elección
de la profesión a seguir, sociales y académicas que depende de cada país, esto ocasiona un bajo
rendimiento académico (Velasco Quintero, 2016).
El modelo de deserción propuesto por Vicent Tinto en 1975, estableció un análisis del
compromiso del estudiante con la universidad a la cual ingresó, añadiendo los compromisos
propios de sus metas académicas. El autor indica que ésto puede ser un determinante para
persistir o abandonar la institución. Pues los compromisos planteados pueden verse afectados
por factores del mismo estudiante y el entorno que lo rodea al ingresar en la universidad
(Saldaña Villa & Barriga, 2010).
A pesar de que la literatura presenta varios estudios aplicados para estudiar la deserción en las
universidades, los diferentes modelos para predecir corresponden a modelos teóricos, los cuales
se enfocan en determinar las causas que pueden afectar al estudiante y por consecuencia llegar
a tomar la decisión de permanecer o desertar de sus estudios académicos de la universidad.
Existen modelos que aplican técnicas de Machine Learning para predecir los estudiantes en
riesgo de desertar, sin embargo, los modelos identificados fueron elaborados para un contexto
de educación superior diferente al que se aplica en el Ecuador. Por lo tanto, se considera
importante diseñar un modelo que permita conocer las características propias de los estudiantes
5
5 OBJETIVOS:
General
• Diseñar un modelo para determinar factores de deserción estudiantil en la Facultad de
Ciencias de la Ingeniería y Aplicadas de la Universidad Técnica de Cotopaxi, a través
de la minería de datos.
Específicos
• Revisar sistemáticamente la literatura para conocer las concepciones teóricas y
filosóficas de la minería de datos y su influencia en la predicción de la deserción
universitaria.
Descripción de la actividad
Objetivos Actividad (tareas) Resultado de la actividad
(técnicas e instrumentos)
Búsqueda de información en
Revisar sistemáticamente la La identificación de estudios
las bases de datos científicas.
literatura para conocer las potenciales.
concepciones teóricas y Investigar las bases teóricas Búsqueda de información en
La adquisición de
filosóficas de la minería de del proyecto. las bases de datos científicas,
información oportuna acerca
datos y su influencia en la Google Scholar, Scielo,
predicción de la deserción Análisis de los contenidos de del tema de investigación.
los documentos Redalyc, entre otros.
universitaria. Marco teórico.
identificados.
En el mimso trabajo para determinar las variables que inciden a que un estudiante renuncie de
sus estudios universitarios, se aplicó el análisis de minería de datos, estableciendo una
metodología de tres algoritmos como son: redes bayesianas, redes neuronales, y árboles de
decisiones, permitiendo que dichos algoritmos determinen si un estudiante desertará o no, por
medio de la herramienta Waikato Environment for Knowledge Analysis (WEKA). Se utilizó el
proceso Knowledge Discovery in Databases (KDD), que consiste en la fuente de información,
preparación de datos, minería de datos, interpretación y evaluación de los conocimientos. Luego
de aplicar los tres algoritmos, así como los softwares, Statistical Package for the Social Sciences
(SPSS) y Waikato Environment for Knowledge Analysis (WEKA), se obtuvieron resultados en
porcentajes que permitieron que los valores generados por los mismos fueran comparados,
aunque en este caso no fueron totalmente comparables
rendimiento académico. Es un tema que hace varios años es preocupante, por tal razón se
realizan estudios para contribuir a determinar las causas que mayor efecto tienen en la
deserción.
Tras la aplicación de los algoritmos se identificaron las variables que influyen en la deserción
como es el caso de las asignaturas aprobadas, cantidad y resultado de asignaturas cursadas,
procedencia y edad de ingreso del estudiante, siendo el caso de los estudiantes del primer año
de carrera. Con todos los algoritmos aplicados, el resultado fue que los porcentajes eran
similares y no se identificaron los mismos atributos (Eckert & Suénaga, 2015).
De igual manera, en el trabajo presentado por (Torres, Ramos, & Moraga, 2016) se realiza, el
estudio de variables que influyen en la deserción de estudiantes universitarios de primer año,
mediante minería de datos, la tasa de deserción de los estudiantes de educación superior se
utiliza para evaluar los procesos de enseñanza en las instituciones. La muestra para este caso
fueron los estudiantes de primer año con 5.547 registros entre los años 2009 – 2015.
Para ello, se desarrolló el proceso de minería de datos con la metodología Cross Industry
Standard Process for Data Mining (CRISP-DM), que tiene los siguientes pasos: comprensión
del negocio, datos, muestra, preparación de datos, eliminar valores nulos y perdidos, trasformar
atributos y seleccionar variables. Se aplicó los algoritmos de árboles de decisiones, métodos
bayesianos y redes neuronales.
Realizaron una evaluación con cuatro experimentos: el primero se utilizó todas variables, el
segundo se descartó variables académicas, el tercero se omitió las variables de aprobación y
promedio final y el cuarto solo se utilizaron las variables académicas de ingreso, las mismas
que fueron analizadas. Los resultados fueron que en los experimentos las variables académicas
no afectan a la deserción, las variables del desempeño académico tienden a afectar en la
9
deserción, con los resultados obtenidos de las técnicas de Random Forest y el Naive Bayes
podrán intervenir en las variables que causen deserción en los estudiantes.
Bases teóricas
Deserción Universitaria
Es la renuncia decisiva del aula de clases por diversos motivos, la deserción conlleva un proceso
lento que se encuentra en el interior del individuo y va creciendo hasta llegar a una decisión
para bien o mal del mismo y el entorno en el que se encuentra (Yepes Delgado, Salazar Béltran,
& Ceferino Martínez, 2017).
Este modelo propuesto en 1990, tiene una completa distribución de las conductas de logro. Se
incluye la persistencia, elección y desempeño. El nivel de deseos tenía un resultado inmediato
en los valores y posibilidades de éxito que influyen en la permanencia en la universidad (Chisco
Ruiz, 2015). El modelo identificado se presenta en la Figura 2.
Spady 1970 analiza la deserción , en donde se utiliza los principios de las causas de deserción,
estableciendo que la decisión de abandonar los estudios depende de los factores individuales
que tiene el individuo sino también de factores sociales pues existe una ruptura entre los mismos
lo que impide que se relacione al individuo con la sociedad (Vásquez Verdugo, 2016).
Para el autor el entorno de la familia influye en la persona sobre su potencial en sus estudios, el
rendimiento académico e intelectual, apoyo de pares y la integración social actúa sobre una
lógica normativa. La integración social tiene un apoyo de pares que causan impactos de
satisfacción en el estudiante e intervienen en la inserción en la universidad y favorecen a
ratificar compromisos que el estudiante se propuso (Chisco Ruiz, 2015). El modelo identificado
se presenta en la Figura 3.
11
En el modelo de Tinto en 1975, citado por (Vásquez Verdugo, 2016) se establece que los
estudiantes estarán en un programa en el que se registraron y cuando los beneficios sean
superiores al esfuerzo, dedicación y otros costos de actividades en la que sus beneficios sean
mayores, existe la probabilidad de que un estudiante tome la decisión de desertar. El modelo
identificado se presenta en la Figura 4.
Bean complementa los modelos de Tinto y Spady en 1980 y 1985 por medio de dos trabajos,
en el primer trabajo al existir evidencia empírica se puede testear mediante variables y en el
segundo trabajo añade en el análisis a estudiantes no habituales como respuesta en aquella época
a un cambio para poder acceder a la educación superior pues la misma era restringida a un grupo
superior (Vásquez Verdugo, 2016). El modelo identificado se presenta en la Figura 5.
12
Variable Definición
Variables de Antecedentes
Grado en que el estudiante ha demostrado sus logros
Desempeño Previo
académicos previos.
Grado en que los padres del estudiante han logrado como
Estatus Socioeconómico
estatus a través de la ocupación familiar.
Si el estudiante es un residente del estado en donde la
Residente en el Estado
institución educacional está.
Distancia a Casa Distancia de su residencia actual a la casa de sus padres.
Tamaño de la comunidad donde el estudiante pasó la
Tamaño de la ciudad
mayor parte de su tiempo en su crecimiento.
Determinantes Organizacionales (Basado en (Price, 1977))
Según (Chisco Ruiz, 2015) el modelo de Pascarella y Terenzini (1985) “propone un modelo
causal en relación con las características institucionales y ambientales. Este es concurrente con
estudios de impacto en diversas universidades”. El modelo identificado se presenta en la Figura
6.
Tipos de deserción
La deserción se da en dos tipos con respecto al tiempo y espacio.
➢ Tiempo
a) Deserción precoz: Persona que fue aceptada en la institución superior y no se
matricula.
14
b) Deserción temprana: Persona que una vez iniciado con sus estudios académicos
decide abandonar los estudios en un lapso de los dos primeros semestres (Fontalvo
Cerpa, Castillo González, & Castillo, 2015).
c) Deserción tardía: Persona que renuncia a sus estudios en los últimos niveles de
estudio (Corzo Salazar, 2017).
➢ Espacio
a) Deserción institucional: El estudiante deja la universidad (Páramo & Correa,
1999).
b) Deserción interna o del programa académico: El estudiante que opta por
cambiarse de carrera en la misma universidad (Gómez Torres, Acevedo
Villalobos, & Salamanca Velandia, 2015).
Factores de deserción
➢ Factores externos
a) Factores institucionales: Describe las oportunidades y posibilidades que la
universidad ofrece para comenzar o continuar con sus estudios.
b) Factores organizacionales: Servicios de la institución que esta ofrece a los
estudiantes que ingresan, enfocándose en la calidad de docencia y experiencias
en las aulas.
➢ Factores bilaterales
a) Factores personales: Depende del estudiante y están relacionados por motivos
psicológicos como emociones, motivos sociológicos debido a influencias
familiares. La insatisfacción de expectativas que desean cumplirse, así como la
falta de motivación para lograr sus objetivos.
b) Factores socioculturales: La forma en como interactúa en el medio que se
encuentra. Inclusive con la integración en un grupo de personas de su misma
edad y el ambiente universitario que pueda generarse cuando un estudiante
comienza sus estudios.
➢ Factores internos
a) Factores académicos: El bajo rendimiento que un estudiante puede tener, así
como las dificultades de aprendizaje. Las formas de estudio segui para obtener
resultados que sean satisfactorios (Zavala-Guirado, Álvarez, Vázquez,
Gonzáles, & Bazan Ramírez, 2018).
15
Minería de datos
Se refiere a la obtención de la información que se encuentra oculta, en grandes bases de datos
almacenados en distintos formatos, es decir un proceso posterior para descubrir conocimiento
útil de la información disponible, a fin de contribuir a la toma de decisiones mediante la
generación de información y el análisis de la misma, permitiendo a los negocios tomar
decisiones proactivas (Echeverry Marulanda, Trujillo López, & Mejía Salazar, 2017).
Supervisadas o predictivas
Se utilizan para predecir valores o conducta futura de algún tipo de entidad a través de las
variables dependientes, cuya base se encuentra en las variables independientes previamente
relacionadas (Molina López & García Herrero, 2006).
➢ Predicción
Proceso que busca determinar los valores de una o varias variables, a partir de un conjunto de
datos. La predicción de valores continuos puede planificarse por las técnicas estadísticas de
regresión (Chamba Jiménez, 2015).
➢ Regresión
➢ Clasificación
La clasificación supervisada busca un modelo válido que permita predecir casos futuros por
medio del aprendizaje de casos conocidos, el proceso cosiste en distribuir un conjunto de datos
en grupos, donde cada miembro de un grupo esté cerca de otros y grupos diferentes estén lejos
16
de otros, donde la distancia se mide con relación a las variables especificadas, que se quieren
predecir (Chamba Jiménez, 2015).
Árboles de decisión
• Random forest
El Baggin es una técnica diseñada para la creación de datos de entrenamiento que remuestrea
aleatoriamente el conjunto de datos originales con reemplazamiento, es decir, sin eliminar el
conjunto de datos seleccionados de forma previa a la elección del siguiente subconjunto. Por
tanto, algunos datos pueden ser usados más de una vez en el entrenamiento de los clasificadores
individuales (Rodríguez & Chica, 2012).
• Naive bayes
• Redes de neuronas
Las redes neuronales artificiales son algoritmos adaptivos y elaborados debido a su capacidad
de aprendizaje, es decir una agrupación de algoritmos de comunicación de la neurona biológica
17
• Multilayer perceptron
Se define como una arquitectura de redes neuronales teniendo la posibilidad de generalizar para
generar resultados de forma rápida, posee características de V4 (volumen, velocidad, variedad
y variabilidad) que corresponden a los datos. Se emplean estimadores actualizados a diferencia
de estimadores fijos, que hacen que el modelo pierda precisión luego de un cierto tiempo y se
produzca errores significativos. Este perceptron puede reconocer parámetros que necesiten de
una actualización cada cierto tiempo permitiendo que se modifique solo los estimadores
necesarios para que sea un modelo más preciso que al usar estimadores dinámicos y fijos
(Climent Hernández, Hoyos Reyes, & Martínez Preece, 2017).
No supervisadas o descriptivas
➢ Clustering
Se refiere a la agrupación de datos en clases o clusters que permita a los objetos de un cluster
mantener una similitud alta entre sí, y una similitud baja (sean diferentes) con objetos de otros
clusters, es una técnica de aprendizaje automático no supervisado que conlleva a la búsqueda
de una estructura en una base de datos no etiquetados (Holgado Apaza, 2018).
➢ K – means
➢ Asociación
Realiza un análisis exploratorio a fin de encontrar relaciones dentro del conjunto de datos
independientes (Chamba Jiménez, 2015).
Elecciones presidenciales
Al utilizar herramientas de minería de datos, para la selección de juntas receptoras del voto
(JRV) más representativas, se aplicó la técnica de agrupamiento Clustering, el algoritmo
utilizado fue el K-MEDIAS. Para el presente estudio se eligieron 20 clusters, donde se
determinó que en el cluster 13 se ubican las Juntas Receptoras del Voto con resultados más
cercanos a la distancia Euclidea (Camana, 2016).
Para la distribución del voto se utilizó el árbol de decisión, ya que al ser intuitivos y fáciles de
comprender permitieron obtener información de las parroquias, cantones y provincias que
tienen alta representación de Juntas Receptoras del Voto. Los datos obtenidos sirven de apoyo
para conocer los posibles resultados y a la vez que sirven de base para las próximas elecciones
(Camana, 2016).
19
Educación
➢ Ventajas
• Previene un entorno desfavorable futuro mostrando datos verídicos.
• Con la información obtenida se puede asistir en la toma de decisiones de
estrategias.
• Los usuarios pueden comprender de mejor manera la información y
concomimientos.
• Permite crear formas de enseñanza para mantener clientes, disminuyendo el
riesgo de perder usuarios.
➢ Desventajas
• Al contar con una gran intensidad de trabajo se puede necesitar de una inversión
para los equipos y capacitación personal.
• Existe una inseguridad en los usuarios estudiados por la información que
proporcionada para el estudio.
• Para procesar la información puede tomar algo de tiempo de acuerdo a la
cantidad de base de datos.
• Al no contar con deficiente sistema de seguridad la información del usuario se
pondría en riesgo.
• Cuando la información es inexacta, el proceso no es cumplido y afectaría en la
toma de decisiones de los resultados.
Es un software de minería de datos libre, con una multiplataforma desarrollada por Java en la
Universidad de Waikato, contiene una variedad de algoritmos, sus archivos tienen un propio
formato arff (Attribute Relation File Format) cuenta con una interfaz fácil de manejar, pero al
realizar un proceso en casada no es fácil debuguearlo (Lanzarini & Villa Monte, 2017).
Waikato Environment for Knowledge Analysis (WEKA) tiene algoritmos de clasificación, los
métodos estadísticos usados para validar la clasificación y métodos en las que se pude
disminuir, eliminar transformar datos, tareas de clasificación, regresión clustering (Villanueva
Morales, Lugo Rodríguez, Ramírez Buenrostro, & Ramírez Pérez, 2015).
La herramienta Statistical Package for the Social Sciences (SPSS) fue creada por International
Business Machines (IBM), es un conjunto de herramientas utilizadas para un análisis
estadístico, mediante el procedimiento de los datos. Utiliza un soporte operativo de Windows
con menús desplegables y cuadro de diálogos que facilitan el trabajo del mismo (Guardiola
Jiménez, 2019).
Según (Universidad Privada TELESUP, 2019) muestra las características y ventajas del
Statistical Package for the Social Sciences (SPSS):
Este tipo de software es el más utilizado en todo el mundo permitiendo una investigación,
experimentación y toma de decisiones.
Este proceso iterativo e interactivo en la que el problema con técnicas de análisis de datos
tradicionales y tecnológicas avanzadas para aprender (Gervilla García et al., 2016). El análisis
de este proceso conlleva a una solución de un gran grupo de datos permitiendo obtener
conocimientos mediante la información útil y a la vez permite asociar patrones válidos de los
datos, es un proceso que tiene seis etapas.
• Muestreo: Es una parte que se extrae de un conjunto de datos que se pueda operar
rápidamente y a la vez obtener información importante.
• Exploración: Busca tendencias e incoherencias inesperadas de los datos para
comprender la información que se manipula.
• Modificación: Se cambian los datos mediante la creación, selección y evolución de las
variables orientadas en el proceso de selección correcta del modelo.
• Modelado: El software realiza una combinación de datos para predecir un resultado,
realizándolo de manera automática.
23
• Valoración: Los datos son evaluados por medio de su utilidad y fiabilidad luego de haber
llegado a las conclusiones del proceso (Tamayo Benalcázar, 2017).
CUADRO COMPARATIVO
Cross Industry SEMMA (Sample,
Knowledge Discovery in Standard Process for Explore, Modify,
Metodología
Databases (KDD) Data Mining (CRISP- Model, Assess)
DM)
Consta de 5 fases:
Consta de 5 fases: selección,
comprensión del Consta de 5 etapas:
preprocesamiento,
negocio, entendimiento muestreo, exploración,
Fases transformación, extracción y
de datos, preparación de modificación, modelado
evaluación e implantación.
datos, modelado, y valoración.
evaluación y despliegue.
Los que se destaca la limpieza Se extrae la población
y preprocesamiento de datos, Ciclo de vida de acuerdo muestral, se realiza una
Pasos análisis exploratorio de al modelo de referencia, exploración de la
selección del algoritmo de de acuerdo a tareas. información sobre los
minería de datos, entre otros. datos obtenidos.
Descubre patrones de
negocio desconocidos
Trabaja con un proceso por medio del proceso de
Proceso Es un enfoque práctico.
iterativo-incremental. selección, exploración y
modelado de los
volúmenes de datos.
Fuente: Tomado de Gervilla (2016), Oviedo & Vélez (2015) y Tamayo (2017).
Luego de analizar cada una de las metodologías de minería de datos Knowledge Discovery in
Databases (KDD), Cross Industry Standard Process for Data Mining (CRISP-DM) y SEMMA
(Sample, Explore, Modify, Model, Assess), la metodología que se utilizará es la Knowledge
Discovery in Databases (KDD) porque está conformada por un proceso iterativo - incremental,
el mismo que consta de una pre-etapa y cinco etapas, en el caso de no obtener resultados que
sean satisfactorios al concluir las etapas, se puede volver a una etapa previa, de esta manera se
llega a tener valores de datos que el investigador podrá usar para un posterior análisis.
Técnicas de Preprocesado
El pre-procesamiento de datos es una de las etapas del proceso de descubrimiento de
información o Knowledge Discovery in Databases (KDD), la cual se encarga de la limpieza de
datos, de la integración, transformación y reducción para continuar con la siguiente etapa que
es la extracción. Puesto que muchas de las veces los datos obtenidos contienen registros nulos
o erróneos que conlleva un proceso de minería de datos con pobres resultados se aplica técnicas
de preprocesamiento (García, Ramírez, Luengo, & Herrera, 2016).
El preprocesamiento incluye un rango amplio de técnicas que se agrupan en dos áreas:
preparación de datos y reducción de datos. La preparación de datos se compone por una serie
de técnicas cuyo objetivo es inicializar correctamente los datos que servirán de entrada para los
algoritmos de minería de datos, por ello se considera importante incluso obligatorio el uso de
estas técnicas ya que sin ellas los algoritmos de extracción del conocimiento no podrían
ejecutarse y presentarían resultados erróneos, para ello se incluye la transformación de datos y
normalización, integración, limpieza de ruido e imputación de valores perdidos (García et al.,
2016).
Figura 8: Familias técnicas en preparación de datos
Las técnicas de reducción de datos, se enfocan en obtener una representación reducida de los
datos originales, manteniendo la integridad y la información existente en los datos. Las técnicas
de reducción más relevantes son: la selección de atributos, la selección de instancias o la
discretización (García et al., 2016).
25
Normalize
La herramienta Waikato Environment for Knowledge Analysis (WEKA) posee diversos filtros
sobre datos, permitiendo realizar transformaciones sobre ellos de todo tipo, entre estos tenemos
Normalize: Normaliza todos los datos de manera que el rango de los datos pase a ser [0,1]
(García Morate, 2008).
NumericToNominal
Las métricas empleadas para la evaluación de clasificadores son las técnicas de evaluación de
hipótesis, basadas en precisión como, por ejemplo, el porcentaje de Error de Muestra (o
inversamente el porcentaje de Acierto (Accuracy)), o el Alcance, la Precisión o la Especificidad
(Recall, Precision, Specificity) o técnicas más elaboradas como el Área Bajo la Curva (ROC),
si la curva ROC es = 1, el modelo es ideal para el conjunto de datos, si es mayor que 0.5 es
óptimo y si se menor a 0.5 el modelo es despreciable (Haro, Pazmiño Maji, Conde, & Peñalvo,
2018).
26
Las métricas pueden ser calculadas en base al conjunto de datos que se utiliza para el
entrenamiento y prueba, además se puede emplear la validación cruzada (o no), para evitar
sesgo en las particiones de los datos (Dasso & Funes, 2012).
La precisión global (exactitud), muestra el número total de predicciones correctas del total, la
precisión positiva (sensibilidad), proporción identificados de casos positivos, y la predicción
negativa (especificad), proporción de casos negativos identificados correctamente,
identificados previamente en la matriz de confusión (Dasso & Funes, 2012).
Según el autor (Bigdate, 2019) las métricas de evaluación son las siguientes:
TP
𝑃 = TP+FP (1)
Precisión (P), alta significa pocos falsos positivos, para determinar la tasa de precisión de las
técnicas de minería de datos se considera las ecuaciones propuestas por Bigdate en el año 2019,
las cuales se representan en las ecuaciones (2), (3), (4).
TP
𝑅 = TP+FN (2)
Tasa FP:
FP
𝐹𝑃𝑅 = TN+FP (3)
Medida:
PxR
𝐹1 = 2𝑥 𝑃+𝑅, es la media armónica de P y R. (4)
True Positives (TP): cuando la clase real del punto de datos era 1 (Verdadero) y la predicha es
también 1 (Verdadero).
Verdaderos Negativos (TN): cuando la clase real del punto de datos fue 0 (Falso) y el
pronosticado también es 0 (Falso).
False Positives (FP): cuando la clase real del punto de datos era 0 (False) y el pronosticado es
1 (True).
27
False Negatives (FN): Cuando la clase real del punto de datos era 1 (Verdadero) y el valor
predicho es 0 (Falso).
Según el autor (Ruiz Reina, 2018) menciona que un clasificador que todo lo predijera positivo,
obtendría R=1, pero habría muchos falsos negativos y P sería muy baja.
Un clasificador que sólo predijera positivo a un único ejemplo (positivo) y el resto como
negativo, tendría R muy baja, pero P=1.
TP+TN
𝐴𝐶𝑈𝑅𝑅𝐴𝐶𝑌 = TP+TN+FP+FN (5)
2∗PRECISION∗RECALL
𝐹1 = (6)
PRECISION+RECALL
DataSet
Es un conjunto de datos contenidos en una matriz de datos, la cual se constituye por filas y
columnas, donde la columna representa una variable determinada y la fila el conjunto de datos
del contexto en el que está trabajando. Al generar el conjunto de datos contenidos (Dataset)
permite tener una mejor organización consultar y modificar el conjunto de datos comprendidos
en la hoja de datos (Balagueró, 2018).
Excel
El software Excel, se le considera como una de las aplicaciones fundamentales para el
desarrollo de actividades de cálculo, que permite trabajar con números, letras y gráficos de
forma sencilla e intuitiva, dicho software cuenta con una interfaz dinámica y amigable que
facilita su utilización, ya que al ingresar datos numéricos extensos permite realizar operaciones
matemáticas de forma fácil (Ebriik, 2010).
28
8 HIPÓTESIS
Si se diseña un modelo para determinar factores de deserción, entonces se podrá obtener las
causas y su nivel de influencia predictiva en la deserción de los estudiantes en la Facultad de
Ciencias de la Ingeniería y Aplicadas de la Universidad Técnica de Cotopaxi.
Tipos de investigación
Investigación Bibliográfica
Investigación mixta
Para nuestro proyecto se utilizó la investigación mixta tanto cualitativa como cuantitativa, las
mismas que permitieron conseguir una perspectiva más amplia sobre los factores de deserción
en los estudiantes, con los cuales se obtuvo una mejor exploración y aprovechamiento de datos
29
que fueron analizados y a la vez alcanzando resultados satisfactorios, además estas técnicas
mantienen sus propios procedimientos y estructuras (Pereira Pérez, 2011).
Investigación cuantitativa
Investigación cualitativa
Por medio de este tipo de investigación se estableció un análisis subjetivo, además se obtuvo
datos que no son medibles basados en la entrevista, revisión de documentos, entre otros, con
esto se estableció una reconstrucción de la realidad de la deserción de acuerdo a los criterios de
los autores, con esta investigación se puedo establecer una hipótesis (Portilla Chaves, Rojas
Zapata, & Hernández Arteaga, 2014).
Investigación experimental
Para este proyecto se aplicó la investigación experimental, en la que se identificó las causas y
efectos de la deserción estudiantil, permitió comprender como las variables influyen en los
resultados, en este caso de las variables independientes que ocasionaron un efecto en la variable
dependiente y a la vez se manipuló dichas variables de forma controlada para que los datos
obtenidos sean representativos de la realidad (Arias, 2012).
Métodos de investigación
Método sintético
Técnicas de investigación
Encuesta
Entrevista
Se utilizó la entrevista como técnica de investigación para el desarrollo del proyecto en la que
se interactuó con los directores de cada carrera de la Facultad de Ciencias y Aplicadas, en la
que se obtuvo información sobre los factores de la deserción estudiantil. Luego que se realizó
este método correspondiente y sin ningún inconveniente, se pudo comparar los distintos puntos
de vista u opiniones de los entrevistados sobre el tema de deserción.
Instrumentos de investigación
Cuestionario
Se basa en un conjunto de preguntas sobre aspectos que se desean conocer de una investigación
para obtener información que contribuyan al desarrollo del mismo (García Muñoz, 2014).
Población
Industrial 348
Electromecánica 297
Eléctrica 363
Total 1457
Fuente: Tomado de Departamento de TIC´S de la UTC (2019)
31
Métodos específicos
La metodología seleccionada para el modelo de minería de datos corresponde a la Knowledge
Discovery in Databases (KDD), la misma que se refiere a un proceso de descubrir conocimiento
útil almacenados en grandes bases de datos. Esta metodología consta de cinco fases que
comprende: etapa de selección, etapa de preprocesamiento, etapa de transformación, etapa de
extracción y finalmente la etapa de interpretación y evaluación.
La presente metodología se considera iterativa puesto que la salida de alguna de las fases logra
hacer regresar a anteriores pasos, ya que a menudo son necesarias diversas iteraciones para
extraer conocimiento de alta calidad, de igual manera es interactivo debido a que el usuario o
experto en el dominio del problema debe ayudar en la preparación de datos y validar el
conocimiento extraído entre otras actividades (Sarasa, Suárez, & Sánchez, 2008).
Etapa de selección
Etapa de pre-procesamiento
Los datos ruidos (noisy data) son valores significativos que se encuentran fuera del rango de
valores esperados. Los datos desconocidos (empy) se refieren a aquellos a los cuales no les
corresponde un valor en el mundo real y los missing, corresponden al valor que no fue
capturado. Los datos nulos son datos desconocidos por los sistemas gestores de bases de datos
relacionales (SGBDR). En la etapa de pre-procesamiento todos estos valores se ignoran, es
32
decir, se reemplazan por un valor más cercano, utilizando las métricas estadísticas como: la
media, la moda, el mínimo y el máximo (Timarán-Pereira, S. R., Hernández-Arteaga et al.,
2016).
Etapa de trasformación
De acuerdo al autor (Fayyad, Piatetsky-Shapiro, & Smyth, 1996) se buscan características útiles
para representar los datos dependiendo de la meta del proceso. Se utilizan métodos de reducción
de dimensiones o de transformación para disminuir el número efectivo de variables bajo
consideración o para encontrar representaciones invariantes de los datos.
Los métodos de reducción de dimensiones pueden simplificar una tabla de una base de datos
horizontal o verticalmente. La reducción horizontal implica la eliminación de tuplas idénticas
como producto de la sustitución del valor de un atributo por otro de alto nivel, en una jerarquía
definida de valores categóricos o por la discretización de valores continuos (por ejemplo, edad
por un rango de edades). La reducción vertical implica la eliminación de atributos que son
insignificantes o redundantes con respecto al problema, como la eliminación de llaves, la
eliminación de columnas que dependen funcionalmente (por ejemplo, edad y fecha de
nacimiento). Se utilizan técnicas de reducción como agregaciones, compresión de datos,
histogramas, segmentación, discretización basada en entropía, muestreo, entre otras (Berzal &
Marín, 2016).
Etapa de extracción
Diseño de la Investigación
Figura 10: Diseño de la investigación para determinar factores de deserción
El objetivo de la encuesta fue descubrir los factores que afectan a la deserción estudiantil
universitaria. La encuesta constó de tres secciones. La sección 1 recopiló información personal
36
Los resultados para la sección 2 fueron evaluados por dos indicadores donde Si = 1 y No = 0,
otra alternativa fue a través de la escala de Likert (del 1 al 5), donde No influye = 1, Baja
influencia = 2, Mediana influencia = 3, Alta influencia = 4, Influye totalmente = 5. Por otro
lado se aplicó la escala de Likert que es un instrumento psicométrico donde el encuestado debe
indicar su acuerdo o desacuerdo sobre una afirmación, ítem o reactivo, recopila datos
cuantitativos de una investigación son cinco el número de opciones de respuestas más usado
como se puede observar anteriormente, se tiene cinco ítems de evaluación para identificar
factores de deserción estudiantil (Matas, 2018).
Para validar las preguntas de la encuesta, se estableció una prueba piloto, la cual fue dirigida a
los estudiantes de noveno ciclo de la carrera de Sistemas de Información con un total de 42
personas encuestadas. El objetivo era verificar si las preguntas fueron entendibles, como
resultado de esta prueba se corrigió las preguntas de la encuesta original utilizando un lenguaje
fácil de entender, se recopiló información en el que se aplicó el proceso de minería de datos
para obtener resultados.
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Baja Influencia 212 14,6 14,6 14,6
Mediana
455 31,2 31,2 45,8
Influencia
Alta Influencia 587 40,3 40,3 86,1
Válidos Influye
203 13,9 13,9 100,0
Totalmente
Total 1457 100,0 100,0
Se aplicó el alfa de Cronbach, para medir la fiabilidad de la encuesta, técnica utilizada para
determinar el grado en que los elementos del cuestionario se relacionan entre sí. Como resultado
se obtiene un valor de 0,839 a través del software estadístico Statistical Package for the Social
Sciences (SPSS). Debido a que el valor obtenido supera el 0,7 se puede determinar que las
preguntas de la encuesta aplicada son óptimas para el fin propuesto en la investigación. La tabla
7 presenta los resultados obtenidos.
Estadísticos de fiabilidad
0,839 16
Análisis de la información
En la Tabla 8, se muestra un resumen de las características demográficas de los estudiantes
matriculados en la Facultad de Ciencias de la Ingeniería y Aplicadas de la Universidad Técnica
de Cotopaxi.
>29 34 2.33%
Casado 43 2.95%
Divorciado 2 0.14%
Viudo 1 0.07%
38
Mulato 5 0.34%
Indígena 52 3.57%
Afroecuatoriano 10 0.69%
Si 14 0.96%
Discapacidad
No 1443 99.04%
Alto 11 0.75%
Si 314 21.55%
Trabaja
No 1143 78.45%
Nuclear Funcional (Padre,
1030 70.69%
madre y hermanos)
Materno Funcional (Madre y
256 17.57%
hermanos)
Tipo de Hogar
Nuclear Funcional (Cónyuge e
58 3.98%
hijos)
Inmediato Funcional (Otros
113 7.76%
Familiares)
Propia 1058 72.61%
Cedida 36 2.47%
Otro 11 0.75%
Ninguno 57 3.91%
Ninguno 37 2.54%
Municipal 31 2.13%
Colegio de
Particular 160 10.98%
Procedencia
Fiscomisional 65 4.46%
Otro 7 0.48%
Fuente: Grupo de trabajo
Los resultados presentados corresponden a los datos de los estudiantes encuestados, donde se
puede evidenciar como datos prioritarios que la población masculina es más alta con 80.51%
(1173 encuestados), mientras que la población femenina el 19.49% (284 encuestados), en los
grupos comprendidos entre las edades de (21-28 años) se tiene 70.42% (1026 estudiantes), el
93.75% (1366 estudiantes) son solteros, el mayor porcentaje de la población encuestada se
considera mestiza con el 94.71% (1380 estudiantes), el 99.04% (1443 estudiantes) no poseen
ningún tipo de discapacidad, mientras tanto el 68.43% (997 estudiantes) viven lejos de la
universidad, los estudiantes provienen de hogares conformada por padre, madre y hermanos el
70.69% (1030 estudiantes), generalmente residen en un domicilio propio el 72.61% (1058
estudiantes), el nivel educativo del padre es del 47.29% que corresponde a educación básica,
mientras que el nivel de formación de la madre de los estudiantes en su mayoría es de educación
básica con el 47.49% y un alto porcentaje de estudiantes que provienen de colegios fiscales con
el 81.95% (1194 estudiantes).
La Figura 11, presenta el modelo conceptual propuesto para determinar factores de deserción
estudiantil. El modelo propuesto consta de cuatro dimensiones y doce factores que podrían ser
considerados como causas de deserción en la universidad en la cual se aplicó el estudio.
40
Modelo para determinar factores de deserción estudiantil universitaria en la Facultad de Ciencias de la Ingeniería y Aplicadas.
Regresión lineal
La regresión lineal simple consiste en una técnica estadística, la misma que analiza la relación
entre dos variables cuantitativas para comprobar si la relación es lineal. Al tener más de dos
variables se define como una regresión múltiple. Por otra parte, la finalidad de la regresión es
explicar el comportamiento de una variable Y (dependiente o endógena) a partir de otra variable
X (independiente o exógena) (Laguna, 2009).
Es un método de estimación utilizada cuando se realiza un ajuste del modelo de regresión lineal
simple al utilizar parámetros. Permite obtener un hiperplano para poder minimizar la suma de
los cuadrados de las distancias entre las observaciones de la variable y el mismo hiperplano
(residuos). Además, de que este método permite sumar las distancias al cuadro y define como
otro supuesto razonable que es arbitrario cuando se trata de acumular las distancias que deben
ser manejadas y entendidas (Chirivella Gonzáles 2019).
El método de ajuste por mínimos cuadrados o regresión lineal permite obtener la pendiente a
de la recta y la ordenada en el origen, correspondientes a la recta y = ax + b que mejor se ajusta
a los n datos (xi, yi), es decir, permite establecer una relación funcional entre dos variables;
donde x es la variable independiente, (y) es la variable dependiente. En otras palabras (y)
depende de (x), en donde (y) – (x) son dos variables importantes (Catarina 2006).
Según el autor (Hurtado Crúz, 2016) menciona que el método de mínimos cuadrados se aplica
para ajustar rectas a una serie de datos presentados como punto en el plano.
Supongamos que se tienen los siguientes datos para las variables (x), (y).
Las expresiones de las variables sean de tipo lineal, según Hurtado en el 2016 se presenta en la
ecuación (7).
42
𝑦 = 𝑚𝑥 + 𝑏 (7)
El método de mínimos cuadrados nos proporciona un criterio a través del cual se obtiene la
mejor recta que representa a los puntos dados, las ecuaciones (8), (9), (10) se presentan en base
al trabajo realizado por Hurtado (2016).
Se desearía tener
𝑦𝑖 = 𝑚𝑥𝑖 + 𝑏 (8)
Para todos los puntos (𝑥𝑖, 𝑦𝑖) de (𝑖 = 1),….,n. Sin embargo, como general
𝑦𝑖 ≠ 𝑚𝑥𝑖 + 𝑏 (9)
𝑦𝑖 − 𝑚𝑥𝑖 + 𝑏 (10)
Novales (2010) propone las ecuaciones de la regresión lineal a través de minimos cuadrados
los cuales se presentan en las ecuaciones (11), (12). En general, si primero despejamos β0 en
(11), tenemos:
𝑛
∑𝑖=1 𝑦𝑖−𝛽1 ∑𝑛
𝑖=1 𝑥𝑖
𝛽0 = n
= 𝑦̅ − 𝛽1𝑥̅ (11)
43
Que se utiliza para estimar los mínimos cuadrados ordinarios (MCO) de β0, una vez que se tiene
el estimador de 1. Sustituyendo en (12), se tiene:
𝑛 𝑛 𝑛
1 𝑛
∑ 𝑦𝑖𝑥𝑖− (∑𝑖=1 𝑥𝑖)(∑𝑖=1 𝑦𝑖) ∑𝑖=1 (𝑥𝑖−𝑥̅ )(𝑦𝑖−𝑦̅)
𝑖=1 𝑛 𝑛𝑆𝑥𝑦 𝑆𝑦
𝛽1 = 𝑛 = 𝑛 = = 𝑝𝑥𝑦 𝑆𝑥 (12)
∑
1 𝑛
𝑥𝑖 2 − (∑𝑖=1 𝑥𝑖)2 ∑𝑖=1 (𝑥𝑖−𝑥̅ )2 𝑛𝑆𝑥 2
𝑖=1 𝑛
V13 Bullying
V3 Residencia
Expectativas respecto a la carrera
V7
seleccionada
Variable dependiente
Estimation Command:
LS V16 V10 V13 V14 V17 V27 V28_4 V30 V6 V5 V8 C
Estimation Equation:
V16 = C(1)*V10 + C(2)*V13 + C(3)*V14 + C(4)*V17 + C(5)*V27 + C(6)*V28_4 + C(7)*V30 +
C(8)*V6 + C(9)*V5 + C(10)*V8 + C(11)
Substituted Coefficients:
V16 = 0.151695876998*V10 + 0.123390821825*V13 + 0.139288149971*V14 - 0.084202833337*V17
+ 0.117401452718*V27 + 0.133946726279*V28_4 + 0.153413068987*V30 - 0.114032604774*V6 -
0.0963022550382*V5 - 0.091295282887*V8 + 0.166226211771
Sample: 1 1457
Prob(F-statistic) 0.000000
46
La Tabla 13, presenta el resultado del modelo ajustado después de eliminar las variables que
estadísticamente no son significativas, lo cual se puede evidenciar por su peso correspondiente
a valores inferiores a 0.05. Es importante resaltar que para la evaluación del modelo se
consideró el 95 % de confianza para el indicador estadístico (Prob).
En la salida de la estimación se muestra los principales resultados obtenidos en relación con los
parámetros de test de significancia y con el contraste de las hipótesis obtenidas, respecto a las
12 variables predictoras y el valor del coeficiente (𝛽) que presenta el nivel de significancia
estadística positiva y negativa respecto a cada variable identificada.
Sample: 1 1457
Prob(F-statistic) 0.000000
0.8
0.4
0.0
-0.4
-0.8
250 500 750 1000 1250
V16 Residuals
La Figura 14, presenta una serie con tendencia común con un componente determinista, es
decir, los mismos datos en orden aleatorio.
0.8
0.4
0.0
1.2
0.8 -0.4
0.4
0.0
-0.4
-0.8
250 500 750 1000 1250
Etapa de pruebas
𝑠2 (𝐾−3)2
𝐽𝐵 = 𝑛 ∗ + (13)
6 24
En donde:
n = representa el tamaño de la muestra
S = coeficiente de asimetría
K= coeficiente de kurtosis
Para la comprobación del supuesto de normalidad de los datos se utilizó la prueba estadística
Jarque- Bera que consiste en la medida de bondad para los ajustes de desviación de la
normalidad y está basada en los valores de kurtosis y asimetría de la muestra (Alfranca, 2009).
La kurtosis es una métrica adimensional con el cual se determinara el grado de concentración
que tienen los valores de la variable, en la zona central de la distribución de frecuencias
(Quintero & Martín-landrove, 2019).
40 Jarque-Bera 183.0842
Probability 0.000000
0
-0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0
49
Supuesto de heteroscedasticidad
La heteroscedasticidad es aquel en que las varianzas de las perturbaciones no son constantes,
por lo tanto, la variabilidad es diferente para cada observación. La matriz de varianzas-
covarianzas es diagonal, por consiguiente, se sigue verificando independencia entre las
observaciones aunque éstas no provienen de la misma población (Barreiro, Vicente, & Pintos
Clapés, 2005).
Test Equation:
Sample: 1 1457
Prob(F-statistic) 0.504562
La Figura 16, representa el resultado del método de minimos cuadrados ordinarios respecto a
las variables resultantes residuales como factores influyentes positivos y negativos con la
deserción universitaria.
51
V5 V8 C
1.2 1.5 1.2
Conducta en el aula de clases (V10): presenta una relación directamente proporcional con la
deserción. Este factor se puede explicar debido a que la conducta en el aula de clases es
considerada como un problema, cuando un estudiante emite una conducta agresiva porque
reacciona ante un conflicto. La relación de la conducta agresiva del estudiante puede originarse
de problemas de relación social con otros estudiantes o docentes. Una conducta agresiva del
estudiante podría ser considerada como una práctica negativa que ha conducido a las malas
relaciones interpersonales que genera malestar social. La manera de comportarse de una
persona puede ser considerada como un factor de deserción (Freire Bayas, 2014).
Bullying(V13): podría ser considerado como una causante de la deserción, este problema
relaciona signos como burlas, insultos o una exclusión social que supone indiferencia entre los
estudiantes dentro de las instituciones educativas (Lladó & Mares, 2017). Presenta afectaciones
en el desempeño académico causando la deserción (Millan Reyes, Barrera Sánchez, & Ospina
Diaz, 2015).
Motivación del docente – alumno (V17): se refiere al incentivo emocional recibido por el
cumplimiento adecuado con tareas asignadas. De igual manera puede ser considerada como el
conjunto de principios (atención, respeto, cordialidad, responsabilidad, entre otros) de
enseñanza y educación (García Rangel, García Rangel, & Reyes Angulo, 2014). La motivación
docente-alumno puede ser identificada como factor que influye en la deserción estudiantil
debido a la falta de interés del alumno con su formación académica (García Rangel et al., 2014).
Al contrario, un estudiante motivado, puede alcanzar sus metas de éxito académico. Por tal
razón se considera importante que la motivación es un estudio fundamental a la hora de analizar
la deserción.
Adicción de las redes sociales (V28.4): se conoce como aquella conducta repetida que resulta
placentera y genera una pérdida de control en el sujeto con una interferencia grave en su vida
cotidiana, a nivel familiar, laboral o social. Así, en las redes sociales se puede acceder a
contenidos sin fines de educación. Las personas adictas a las redes sociales experimentan un
53
se puede identificar que el 41% de los estudiantes indica que ellos no eligieron la carrera por
vocación, así como también la institución en la que estudian, provocando que el fenómeno de
la deserción aumente, conforme a la variación en el sistema de ingreso a carrera.
Problemas familiares (V9): son problemas que se suscitan en el hogar, por ejemplo: la
violencia, el desinterés y la falta de preocupación por parte de los padres para con sus hijos,
problemas de salud, entre otros (Peña, Soto, & Calderón, 2016). Los jóvenes que, agobiados
por problemas familiares de diversa índole, corren el riesgo de abandonar sus estudios, debido
a que estos problemas pueden ocasionar un excesivo porcentaje de faltas permitidas en la
reglamentación universitaria (Zavala Soto, 2017).
Residencia (V3): el lugar de residencia es un factor importante debido a los efectos relevantes
que tiene sobre la deserción, ya que está relacionada con el lugar donde vive el estudiante
(Osorio, Bolancé, & Castillo Caicedo, 2019). Se considera un factor en el caso de estudio,
debido a que el 42% de los alumnos que contestaron la encuesta residen en las provincias de
Tungurahua y Pichincha. Esto puede ocasionar atrasos al inicio de sus actividades académicas,
gasto en el transporte diario, bajas calificaciones, entre otros.
La función del método BestFirst, consiste en una colina codiciosa escalada con retroceso, que
permite ver la correlación que existe entre las diferentes variables, mientras que el atributo
CfsSubsetEval, considera el valor predictivo de cada atributo individualmente, junto con el
grado de redundancia entre ellos (Gutiérrez García, 2016). El resultado de la aplicación de este
método se presenta en la Tabla 15.
Luego se aplicó el método GreedyStepwise, que se refiere a la escalada de colina codiciosa sin
retroceso; opcionalmente genera una lista clasificada de atributos como se puede visualizar en
la Tabla 16.
56
Por medio del software WEKA se realizó una de la técnica CfsSubsetEval a través de los
métodos BestFirst y GreedyStepwise. La Tabla 15, 16 presenta el resultado obtenido del
proceso de selección de variables en la cual se puede visualizar los pasos asignados para cada
variable.
En la Tabla 17, se visualiza los doce factores de deserción estudiantil con su respectiva
descripción y código.
Bullying Son signos como burlas, insultos o una exclusión social V13
que supone indiferencia entre los estudiantes dentro de las
instituciones educativas (Lladó & Mares, 2017).
Adicción de las redes Se conoce como aquella conducta repetida que resulta V28.4
sociales placentera y genera una pérdida de control en el sujeto con
una interferencia grave en su vida cotidiana, a nivel
familiar, laboral o social (Echeburúa Odriozola, 2012).
57
Fase 3: Extracción
aprendizaje supervisado, es decir muestra al menos una capa oculta con suficientes números de
unidades no lineales. Esta red tiene la capacidad de generalización, facilidad de dar salidas
satisfactorias a entradas que el sistema no ha visto en la fase de entrenamiento (Marín
Diazaraque, 2012).
𝑀𝑖𝑛𝑊𝐸 (14)
E: una función error que evalúa la diferencia entre las salidas de la red y las salidas deseadas.
1
𝐸 = 𝑁 ∑𝑁
𝑛=1 𝑒(n) (15)
Donde N: es el número de patrones o muestras y e(n): es el error cometido por la red, para el
patrón n, dado por:
1 𝐶
𝑒(n) = ∑𝑖=1(𝑠𝑖, (𝑛) − 𝑦𝑖(𝑛))2 (16)
𝑛𝐶
Naive Bayes: combina la clasificación y predicción con la finalidad de construir modelos para
predecir posibles resultados a partir de la asociación de datos históricos (Dueñas Reyes, 2009).
Otros autores consideran que es un problema de decisión binario con dos posibles decisiones
(d1 frente a d2), una función de decisión es una función continua (Larrañaga, Inza, & Moujahid,
2010).
𝑟 = 𝑅2 → 𝑅 (17)
59
J48: creado por Ross Quinlan en 1984, el cual es conocido también como un algoritmo de
inducción que genera una estructura de árbol a partir de subconjuntos o ventanas extraídas de
un grupo de datos de entrenamiento, además se considera que el árbol de decisión J48, tiene
una alta precisión en comparación con los clasificadores SMO y Naive Bayes (Vizcaino
Garzón, 2008).
El funcionamiento del algoritmo J48, consiste en los nodos internos que son los diferentes
atributos, las ramas son los posibles valores y nodos finales (hojas), que corresponden a la
clasificación, por ello se considera un método iterativo debido a que va colocando los posibles
valores de las características (información ganada). Cuando todas caigan en una clasificación
y ya no exista ambigüedad entonces se asigna una raíz o un nodo. Un árbol consta de una raíz
y puede tener dos o más nodos hijos intermedios. En la mayoría de los árboles se considera un
nodo intermedio como un nodo de predicción, la cual nos dirá según el valor numérico porque
rama debe bajar. Esto puede ser visto como nodos circulares para los de predicción y
rectangulares para los de decisión (Condori Castro & Sulla Torres, 2016).
Random Forest: se caracteriza por correr eficientemente sobre grandes bases de datos,
proporciona el método experimental para detectar interacciones entre variables, esto
proporciona las estimaciones para saber que variables son importantes en la clasificación
(Escobar., Burbano., & Puris., 2016).
60
Donde {k} se distribuyen de manera idéntica e independiente. Los vectores aleatorios y cada
árbol emiten un voto unitario para la clase más popular en la entrada x (Breiman, 2012).
Según el autor (Zaballa Pardo, 2016) debido a la restricción de igualdad lineal que involucra
los multiplicadores de Lagrange ∝ 1, el problema más pequeño posible involucra dos de estos
multiplicadores. Entonces, para cualesquiera dos multiplicadores. ∝1 y ∝2, las restricciones se
reducen a:
0 ≤∝ 1, ∝ 2 < 𝐶, (19)
𝑦1 ∝ 1 + 𝑦2 ∝ 2 = 𝑘, (20)
En base a la revisión literaria, se considera que las técnicas antes mencionadas son importantes
ya que aportan al proceso de predicción en nuestro trabajo de investigación.
Resultados
Prueba 44%
Validación cruzada 10
GUI False
AutoBuild True
BatchSize 100
Debug False
Decay False
DoNotCheckCapabilities False
HiddenLayers a
LearningRate 0.3
Momentum 0.2
NominalToBinaryFilter True
Especificaciones
NormalizeAttributes True
NormalizeNumericClass True
NumDecimalPlaces 2
Reset True
Seed 0
TrainingTime 500
ValidationSetSize 0
ValidationThreshold 20
En la Tabla 19, se presenta la especificación del modelo de red neuronal a través del método
Multilayer Perceptrón, se obtuvo una clasificación correcta de instancias con una tasa del 89%
de precisión de la predicción. La función Sigmoid Node, se lo utiliza para la propagación hacia
atrás y datos asociados. Exiten nodos en la capa oculta de esta red, tal es el caso de los nodos
de salida que son unidades lineales, la función Sigmoid Node 0 representa la unidad de salida
y los Sigmoid Node 1- 22 son las unidades ocultas, estos valores están generados por los pesos
de interconexión.
62
Tabla 19: Resultado de la herramienta que utiliza Weka que es Multilayer Perceptron
Naive Bayes esta conformada por especificaciones que permiten definir algunas características
para los valores, asi con el NumDecimalPlaces define el número de decimales de salida y el
DisplayModellnOldFormat que usa un formato antiguo para la salida del modelo. Se utiliza el
formato antiguo cuando hay muchos valores de clase y el formato nuevo cuando hay menos
clases. Asi también como el BatchSize de 100 números de instancias para procesar un lote de
predicción. Para el porcentaje de entrenamiento se empleó el 66% y un 44% del conjunto de
datos para prueba. Además, el valor de la validación cruzada (cross-validation) fue 10
iteraciones, es decir divide el conjunto total en subconjuntos de tamaño 10 partes. Se presenta
las especificaciones de la técnica Naive Bayes en la Tabla 20.
Prueba 44%
Validación cruzada 10
BatchSize 100
Debug False
DoNotCheckCapabilities False
NumDecimalPlaces 2
UseKernelEstimator False
UseSupervisedDiscretization False
En la Tabla 21, se muestra el resultado obtenido con la técnica Naive Bayes, el tiempo que se
demoró en ejecutar fue de 0.03 segundos. Las instancias correctamente clasificadas se
denominan exactitud que corresponden al 88% que representa 1283 encuestas. Para la
obtención de los resultados se empleó el DataSet compuesto por las 42 variabables
independientes (predictoras), además arroja los resultados de 1 y 0 puesto que se trabajó con
datos binarios, seguidamente muestra el resultado total por variables.
64
Tabla 21: Resultado de la herramienta que utiliza Weka que es Naive Bayes
V2 V16 V26.1
0 112.0 1333.0 0 55.0 999.0 0 40.0 426.0
1 2.0 14.0 1 59.0 348.0 1 74.0 921.0
[total] 114.0 1347.0 [total] 114.0 1347.0 [total] 114.0 1347.0
V3 V17 V27
0 75.0 924.0 0 62.0 272.0 0 23.0 198.0
1 39.0 423.0 1 52.0 1075.0 1 91.0 1149.0
[total] 114.0 1347.0 [total] 114.0 1347.0 [total] 114.0 1347.0
65
En la Tabla 22, se describe la salida de pantalla que arrojó la herramienta Weka con el árbol de
decisión J48, el tiempo de ejecución fue de 0.12 segundos. Asi mismo, se obtuvo una
clasificación correcta de instancias que se denominana excatitud con un valor de 92% de
precisión de la predicción. El árbol de decisión esta conformado por 13 hojas y con un tamaño
del árbol de 25, siendo la Motivación del docente- alumno (V17) el nodo raiz o padre, además
de sus nodos intermedios e hijos, estos nodos son de predicción y de decisión. En la Figura 18,
se presenta el árbol de decisión generado a través de la herramienta Weka.
Tabla 22: Resultado de la herramienta que utiliza Weka que es J48 (continuación)
=== Classifier model (full training set) ===
J48 pruned tree
------------------
V17 = 0
| V16 = 0: 1 (193.0/20.0)
| V16 = 1
| | V27 = 0
| | | V28.5 = 0: 1 (2.0)
| | | V28.5 = 1
| | | | V3 = 0
| | | | | V23 = 0: 0 (6.0/1.0)
| | | | | V23 = 1: 1 (3.0)
| | | | V3 = 1: 0 (3.0)
| | V27 = 1
| | | V11 = 0: 1 (61.0/11.0)
| | | V11 = 1
| | | | V28.3 = 0
| | | | | V32 = 0: 1 (5.0)
| | | | | V32 = 1
| | | | | | V23 = 0: 1 (2.0)
| | | | | | V23 = 1
| | | | | | | V29 = 0: 0 (17.0/2.0)
| | | | | | | V29 = 1: 1 (3.0/1.0)
| | | | V28.3 = 1
| | | | | V22 = 0: 0 (3.0/1.0)
| | | | | V22 = 1: 1 (34.0/4.0)
V17 = 1: 1 (1125.0/51.0)
Number of Leaves: 13
Size of the tree: 25
Time taken to build model: 0.12 seconds
=== Stratified cross-validation ===
=== Summary ===
Correctly Classified Instances 1341 92.0384 %
Incorrectly Classified Instances 116 7.9616 %
Kappa statistic 0.1557
Mean absolute error 0.1294
Root mean squared error 0.2697
Relative absolute error 90.8442 %
Root relative squared error 101.2563 %
Total, Number of Instances 1457
El árbol de decisión J48 contiene especificaciones, tal es el caso del confidenceFactor que es
un factor de confianza para la moda, al igual que el minNumObj que define el número mínimo
de instancias por hoja. Al igual que en el BatchSize de 100 números de instancias para procesar
un lote de predicción. Para el porcentaje de entrenamiento se empleó el 66% y un 44% del
conjunto de datos para la prueba. Además, el valor de la validación cruzada (cross-validation)
fue 10 iteraciones, es decir divide el conjunto total en subconjuntos de tamaño 10 partes. Se
describe la especificación del árbol de decisión J48 en la Tabla 23.
67
Prueba 44%
Validación cruzada 10
BatchSize 100
BinarySplits False
CollapseTree True
ConfidenceFactor 0.25
Debug False
DoNotCheckCapabilities False
DoNotMAkeSplitPointActua
False
lValue
MinNumObj 2
NumDecimalPlaces 2
NumFolds 3
Especificaciones
ReduceErrorPruning False
SaveInstanceData False
Seed 1
SubtreeRaising True
Unpruned False
UseLaplace False
UseMDLcorrection True
Tabla 24: Resultado de la herramienta que utiliza Weka que es Random Forest
Prueba 44%
Validación cruzada 10
BagSizePercent 100
BatchSize 100
BreakTiesRandomly False
CalcOutOfBag False
ComputeAttibuteImportance False
Debug False
DoNotCheckCapabilities False
Especificaciones
MaxDepth 0
NumDecimalPlaces 2
NumExecutionSlots 1
NumFeatures 0
NumIterations 100
OutputOutOfBagComplexit False
yStatistics
PrintClassifiers False
Seed 1
StoreOutOfBagPredictions False
La presente Tabla 26, contiene el resultado con el Minimum Sequential Optimization (SMO),
el tiempo que se demoró en ejecutar fue de 0.55 segundos. Las instancias correctamente
clasificadas se denominan exactitud que corresponden al 92% que representa 1345 encuestas.
El resultado contiene la Máquina lineal que muestra los pesos de los atributos, no los vectores
de soporte.
70
Prueba 44%
Validación cruzada 10
BatchSize 100
BuildCalibrationModels False
C 1.0
Logistic: -R1.0E-8-M-1 –num-
Calibrator
decimal-places 4
ChecksTurnedOff False
Debug False
DoNotCheckCapabilities False
Epsilon 1.0E-12
Especificaciones FilterType Normalize training data
NumDecimalPlaces 2
NumFolds -1
RandomSeed 1
ToleranceParameter 0.001
J48 92%
SMO 92%
Al emplear las técnicas de minería de datos que posee la herramienta Weka, se obtuvo como
resultado que J48, Random Forest y SMO, tiene más alto porcentaje de instancias correctamente
clasificadas. Con esta tasa de precisión de la predicción del 92%, lo que indica que el modelo
puede ser considerado como óptimo en términos de confiabilidad.
Por otro lado, para la evaluación del modelo basado en minería de datos para determinar
factores de deserción estudiantil universitaria, se realizó a través de métricas de evaluación
como es la precisión y la confiabilidad, el nivel del modelo propuesto se determinó en términos
de confianza y fiabilidad del modelo de predicción.
Como se puede evidenciar en la Tabla 29, los coeficientes corresponden a valores de la ROC
Area cercanos a 1 especialmente en la técnica de Naive Bayes por lo tanto se comprueba que el
modelo propuesto podría ser considerado como óptimo en técnicas de predicción de la
deserción.
Tabla 29: Resultados de las técnicas de minería de datos que posee Weka
Mean Absolute
Algoritmos Kappa Statistic F -Measure ROC Área
Error
Multilayer
0.14 0.10 0.947 0.673
Perceptron
ThresholdCurve
Según el autor (García Morate, 2008) La visualize thresold curve, muestra la variación de las
proporciones de cada clase. Para nuestro modelo, se situó en el eje (x) los coeficientes falsos
positivos y en el eje (y) los coeficientes de verdaderos positivos y de esa manera se obtuvo el
área bajo la curva (ROC), por ende, aparecerá sobre la gráfica el valor del área de ésta. En la
Figura 19, se presenta el resultado del proceso experimental aplicando las técnicas de minería
de datos que posee la herramienta Weka que es Naive Bayes, en la Figura 20: el árbol de
decisión J48, en la Figura 21: el Minimal Sequential Optimization (SMO), en la Figura 22: el
árbol de decisión Random Forest y en la Figura 23: la red neuronal Multilayer Perceptron, se
puede evidenciar el valor encontrado de la curva ROC, por cada una de las técnicas antes
mencionadas.
Figura 19: ThresholdCurve con 1 - Naive Bayes Figura 20: ThresholdCurve con 1 - J48
Figura 21: ThresholdCurve con 1 - SMO Figura 22: ThresholdCurve con 1 – RandomForest
74
CostCurve
Según el autor (García Morate, 2008) el costo de la curva, también conocido como visualize
cost curve, muestra una gráfica que indica la probabilidad de coste a la sensibilidad entre clases.
De igual manera, se presenta en la Figura número 24 el CostCurve del Naive Bayes, en la Figura
25 el J48, en la Figura 26 el Minimal Sequential Optimization (SMO), en la Figura 27 el
Random Forest y en la Figura 28 el Multilayer Perceptron, haciendo referencia a cada técnica
de minería de datos aplicados en el proceso de determinación de factores que inciden en la
deserción estudiantil universitaria.
Figura 24: CostCurve con 1 - Naive Bayes Figura 25: CostCurve con 1 - J48
Figura 26: CostCurve con 1 – SMO Figura 27: CostCurve con 1 – RandomForest
75
Impacto económico
Se considera uno de los impactos más importantes ya que permitirá conocer el efecto que genera
la deserción estudiantil a nivel económico, permite tener una eficiencia interna de la institución
en situaciones como la reducción del gasto administrativo. Además, el incremento de retención
de los estudiantes permitirá un aumento del presupuesto institucional universitario.
Impacto social
Beneficia a los estudiantes porque se podría identificar los problemas que les ateñe a través de
un seguimiento a los mismos y por medio de programas de retención, se puede contribuir a que
los estudiantes culminen con éxitos sus estudios y por ende obtengan un título profesional.
Una vez que el estudiante concluya con su formación académica puede insertarse en el campo
laboral, tener una situación económica estable que permita mejorar su condición de vida,
disminuir las tasas de desempleo y lo más importante contribuir al desarrollo del país.
76
Gastos directos
Tabla 30: Descripción gastos directos
TOTAL $268,70
Fuente: Grupo de trabajo
Gastos indirectos
Tabla 31: Descripción gastos indirectos
TOTAL $260,00
Fuente: Grupo de trabajo
Gastos aproximados
Tabla 32: Total, Gastos Directos e Indirectos
Descripción Total
13 CONCLUSIONES Y RECOMENDACIONES
Conclusiones
Este apartado del documento se presenta las conclusiones obtenidas del proceso de
investigación:
Recomendaciones
➢ Como trabajo futuro, se recomienda aplicar el mismo proyecto de investigación en las
demás Facultades de la Universidad Técnica de Cotopaxi, pero en este caso tomando en
cuenta sólo a los estudiantes de primero a quinto semestre, puesto que, en la revisión de
la literatura, éstos son los ciclos más propensos en riesgo de desertar a fin de determinar
los factores por los cuales los estudiantes de las otras facultades desertan de sus estudios.
➢ La implementación de un sistema informático para la determinación de estudiantes en
riesgo de desertar.
78
14 BIBLIOGRAFÍA
Alania Ricaldi Pit Frank. (2018). Aplicación de técnicas de minería de datos para predecir la
deserción estudiantil en la Facultad de Ingeniería de la Universidad Nacional Daniel
Alcides Carrión. Universidad Nacional Daniel Alcides Carrión.
Alfranca, Ó. (2009). Regulación ambiental e innovación. Regulacion Ambiental e Innovación,
15, 33–50.
Aragón Tobón, O., Clavijo Zapata, S., Puerta Lopera, I., & Sánchez Duque, J. (2014).
Formación académica, valores, empatía y comportamientos socialmente responsables en
estudiantes universitarios. Revista de La Educacion Superior, xliii(169), 89–105.
https://doi.org/10.1016/j.resu.2015.01.003
Arias, F. (2012). El Proyecto de Investigación Introducción a la metodología científica.
Ariza, S. M., & Marín, D. A. (2009). Factores intervinientes en la deserción escolar de la
Facultad de Psicología, Fundación Universitaria Los Libertadores. Tesis Psicológica, 4,
72–85.
Balagueró, T. (2018). Dataset. Retrieved April 15, 2019, from Deusto formación website:
https://www.deustoformacion.com/blog/programacion-diseno-web/que-son-datasets-
dataframes-big-data
Barreiro, J., Vicente, E., & Pintos Clapés, J. (2005). Introducción a Eviews. Universidad de
Vigo.
Berzal, F., & Marín, N. (2016). Data Mining: conceptos y técnicas por Jiawei Han and
Michael Kamber. ResearchGate, (June), 279–317. https://doi.org/10.1016/B978-0-12-
804647-0.00009-7
Bigdate, S. (2019). Selección de métricas de evaluación correcta para modelos de Machine
Learning: Parte 3 – Métrica de clasificación.
Breiman, L. (2012). Random forests. Ensemble Machine Learning: Methods and
Applications, 157–175. https://doi.org/10.1007/9781441993267_5
Breno, M., Peralta, I., Remache, W., & Mayorga, E. (2018). Índice de repitencia y sus causas
en la Facultad de Ciencias Químicas de la Universidad Central del Ecuador. Revencyt,
109–127.
Brian, J., Flores, A., & Ponce, E. (2018). Random Forest para identificar los factores
sociodemográficos asociados al uso de Internet en el Perú. Revista ECIPeru, 13(2), 54–
61. https://doi.org/10.33017/reveciperu2016.0008/
Camana, R. (2016). Potenciales Aplicaciones de la Minería de Datos en Ecuador. Revista
Tecnológia ESPOL- RTE, 29, 170–183.
Campos, D., & Vargas, M. (2009). ¿Cómo abordar las dificultades del aprendizaje?
Retrieved from www.oei.es/historico/idie/dificultad_aprendizaje_creditos.pdf
Castaño, E., & Vásquez, J. (2004). Deserción Estudiantil Universitaria: una aplicación de
modelos de duración. (60), 39–65.
Chamba Jiménez, S. F. (2015). Minería de Datos para segmentación de clientes en la
80
Escobar., H., Burbano., W., & Puris., A. (2016). Análisis inteligente de datos aplicado al
proceso de nivelación en la Universidad Técnica Estatal de Quevedo. Revista
Publicando, 3(7), 33–44.
Fayrix. (2019). Selección de métricas para los modelos de aprendizaje automático.
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). Knowledge discovery and data
mining:towards a unifying framework. Kdd-96, 82–88.
Fernández, C., Leidy, C., Alvarez Vallejo, V., Triviño Arbeláez, J., Ivan, Q., Restrepo, C. P.,
& Giraldo, R. (2018). Aplicación de Técnicas de Minería de Datos para la Identificación
de Patrones de Deserción Estudiantil como Apoyo a las Estrategias de Sara (Sistema De
Acompañamiento para el Rendimiento Académico). 1177–1185.
Fontalvo Cerpa, W., Castillo González, M. P., & Castillo, S. P. (2015). Análisis multivariado
para determinar los factores más relevantes de deserción estudiantil presentes en el
programa de Ingeniería Industrial de una Universidad del Caribe colombiano.
Prospectiva, 13(1), 86. https://doi.org/10.15665/rp.v13i1.363
Freire Bayas, D. E. (2014). La Conducta Disruptiva y su Incidencia en el Rendimiento
Académico de las/os Estudiantes de los 10mos Grados de Educación General Básica
Paralelos “I, Ii” del Colegio Universitario “Juan Montalvo”, de la Provincia de
Tungurahua, Cantón Ambato (Vol. 593). Universidad Técnica de Ambato.
Frites, C., & Miranda, R. (2014). Tutorías y Nivelación en la Universidad De Santiago:
Tensiones y Desafíos en la Implementación de Iniciativas de Permanencia. IV
Conferencia Latinoamericana Sobre El Abandono En La Educación Superior, 1–7.
Garcia, F. (2004). Metodológicas para una encuesta. México: Limusa.
García Morate, D. (2008). Manual de Weka.
García Muñoz, T. (2014). Schnitzler Gut 2008 Long Term Infliximab 614 Pts.Pdf (p. 29). p.
29.
García Rangel, E. G., García Rangel, A. K., & Reyes Angulo, J. A. (2014). Relación maestro
alumno y sus implicaciones en el aprendizaje. Ra Ximhai, 10, 279–290.
https://doi.org/10.35197/rx.10.03.e1.2014.19.eg
García, S., Ramírez, S. G., Luengo, J., & Herrera, F. (2016). Big Data : Preprocesamiento y
calidad de datos. Novática, 17–23.
Gardner, L., Dussán, C., & Montoya, D. (2016). Aproximación causal al estudio de la
deserción en la Universidad de Caldas. Periodo 2012-2014. Revista Colombiana de
Educación, 319–340.
Geometry, R., & Analysis, G. (2017). II Congreso Internacional en Administración de
Negocios Internacionales (p. 778). p. 778.
Gervilla García, E., Jiménez López, R., Montaño Moreno, J. J., Sesé Abad, A., Cajal Blasco,
B., & Palmer Pol, A. (2016). La metodología del Data Mining. Una aplicación al
consumo de alcohol en adolescentes. Adicciones, 21(1), 65.
https://doi.org/10.20882/adicciones.253
Gironés Roid, J., Casas Roma, J., Miguinllón, A., & Caihuelas, T. (2017). Minería de datos,
Modelos y Algoritmos (Primera Ed). Barcelona: UOC.
82
Gómez Torres, F. A., Acevedo Villalobos, E. P., & Salamanca Velandia, S. R. (2015).
Diagnóstico De Deserción Académica Universitaria De La Facultad De Medicina
Veterinaria Y Zootecnia I. Percepción De Los Estudiantes Activos. Puente, 9(1), 75–84.
González Fiegehen, L. E. (2006). Repitencia y Deserción en América Latina 2006-19.
ResearchGate, 3, 2–40.
Guardiola Jiménez, P. (2019). Capítulo 1 «Estructura del SPSS» (pp. 1–26). pp. 1–26.
Retrieved from https://www.um.es/docencia/pguardio/documentos/spss_1.pdf
Gutiérrez García, J. A. (2016). Comenzando con Weka : Filtrado y selección de subconjuntos
de atributos basada en su relevancia descriptiva para la clase . ResearchGate, (January),
18.
Haro, S., Pazmiño Maji, R., Conde, M., & Peñalvo, F. (2018). Minería de datos para descubrir
tendencias en la clasificación de los trabajos de titulación. Congreso de Ciencia y
Tecnología ESPE, 13(1), 125–128. https://doi.org/10.24133/cctespe.v13i1.739
Himmel, E. (2018). Modelo de análisis de la deserción estudiantil en la educación superior.
ResearchGate, 92–107. https://doi.org/10.31619/caledu.n17.409
Holgado Apaza, L. A. (2018). Detección de patrones de bajo rendimiento académico
mediante técnicas de minería de datos de los estudiantes de la Universidad Nacional
Amazónica de Madre de Dios. Universidad Nacional del Altiplano.
Hurtado Crúz, E. R. (2016). El método de mínimos cuadrados. Facultad de Ciencias UMAN,
1, 2–5.
Jadue, G. (2002). Factores psicológicos que predisponen al bajo rendimiento, al fracaso y a la
deserción escolar. Estudios Pedagógicos (Valdivia), 193–204.
Laguna, C. (2009). Correlación Y Regresión Lineal. Instituto Aragones De Ciencia De La
Salud, 1–18. Retrieved from http://www.ics-aragon.com/cursos/salud-
publica/2014/pdf/M2T04.pdf
Lanzarini, L. C., & Villa Monte, A. Enseñanza De La Minería De Datos Y El Impacto De Las
Herramientas De Software Utilizadas. , (2017).
Larrañaga, P., Inza, I., & Moujahid, A. (2010). Clasificadores Bayesianos. Universidad del
País Vasco-Euskal Herriko Unibertsitatea.
Lladó, M., & Mares, H. (2017). Factores Que Impactan La Deserción Escolar: Percepción De
Los Estudiantes De La Escuela Preparatoria Federalizada No.1 Ing. Marte R. Gómez.
Comie, (2015), 1–12.
Marín Diazaraque, J. M. (2012). Introducción a las redes neuronales aplicadas. Manual Data
Mining, 1–31.
Marrón, J. A. (2008). Análisis de series temporales. Univerisidad Complutense de Madrid,
1(Análisis temporal), 111–128. https://doi.org/10.3989/mc.2004.v54.i274.233
Martinez, A. (2018). Qué es Estado de ánimo - Psicología en Positivo. Retrieved June 23,
2019, from https://www.antonimartinezpsicologo.com/estado-de-animo
Martínez, E. H., & Sanjurjo, R. L. (2014). Minera de datos aplicada a la detección de Cáncer
de Mama.
83
Matas, A. (2018). Diseño del formato de escalas tipo Likert: Un estado de la cuestión. Revista
Electronica de Investigacion Educativa, 20(1), 38–47.
https://doi.org/10.24320/redie.2018.20.1.1347
Maya, E. (2014). Métodos y técnicas de investigación (Universidad Nacional Autónoma de
México). https://doi.org/10.1017/CBO9781107415324.004
Méndez Rodríguez, A. (2008). Investigacion bibliografica.pdf.
Millan Reyes, L. C., Barrera Sánchez, L. F., & Ospina Diaz, J. M. (2015). Caracterización del
bullying en estudiantes de medicina de Tunja , Boyacá. Revista Virtual Universidad
Católica Del Norte, 102–112.
Ministerio Coordinador de Patrimonio. (2015). Nacionalidades y Pueblos Indígenas y
Políticas Interculturales en Ecuador. Unicef.
Miranda, M. A., & Guzmán, J. (2017). Análisis de la deserción de estudiantes universitarios
usando técnicas de minería de datos. Formacion Universitaria, 10(3), 61–68.
https://doi.org/10.4067/S0718-50062017000300007
Molina López, J. M., & García Herrero, J. (2006). Técnicas de análisis de datos. Universidad
Carlos III de Madrid.
Mosteiro García, J. (1997). El género como factor condicionante de la elección de carrera :
hacia una orientación para la igualdad de oportunidades entre los sexos. 305–315.
Navarro, R. (2008). El Rendimiento Académico : Concepto, Investigación Y Desarrollo.
REICE Revista Electrónica Iberoamericana Sobre Calidad Eficacia y Cambio En
Educación, 6(2), 59–99. https://doi.org/2152
Osorio, A. M., Bolancé, C., & Castillo Caicedo, M. (2019). Deserción y graduación
estudiantil universitaria: una aplicación de los modelos de supervivencia. Revista
Iberoamericana de Educación Superior, iii, 31–57.
https://doi.org/10.22201/iisue.20072872e.2012.6.55
Oviedo C., E. A., Oviedo C., A. I., & Vélez S., G. L. (2015). Minería De Datos: Aportes Y
Tendencias En El Servicio De Salud De Ciudades Inteligentes. Revista Politécnica ISSN
Año, 11(20), 111–120.
Padilla, A. (n.d.). El desarrollo del proceso de aprendizaje en el aula. Retrieved June 23, 2019,
from https://www.tendencias21.net/ciclo/El-desarrollo-del-proceso-de-aprendizaje-en-el-
aula_a41.html
Padilla Gómez, A., López Rodríguez del Rey, M. M., & Rodríguez Morales, A. (2015). La
formación del docente universitario. Concepciones teóricas y metodológicas. Revista
Cientifica de La Universidad de Cienfuegos, 86–90.
Padilla Muñoz, A. (2010). Discapacidad : contexto , concepto y modelos. International Law,
Revista Colombiana de Derecho Internacional, 16, 381–414.
Páramo, G. J., & Correa, C. A. (1999). Deserción estudiantil universitaria.
Conceptualización. Colombia: Revista Universidad Eafit.
Pastrana, K., Guitiérrez, A., & Mendoza, M. (2018). Deserción escolar en el Instituto
Nacional Julio Cesar Castillo Ubau del turno matutino en el primer semestre del año
2017 en el municipio de Condega Estelí.
84
Peña, J., Soto, V., & Calderón, U. (2016). La influencia de la familia en la deserción escolar.
Revista Mexicana de Investigación Educativa, 21, 881–899.
Pérez, A. M., Escobar, C. R., Toledo, M. R., Gutierrez, L. B., & Reyes, G. M. (2018). Modelo
de predicción de la deserción estudiantil de primer año en la Universidad Bernardo
O´Higgins. Educação e Pesquisa, 44(0), 1–23. https://doi.org/10.1590/s1678-
4634201844172094
Pérez Álvares, P. R., & Aguilar López, D. (2017). Estudios sobre deserción académica y
medidas orientadoras de prevención en la Universidad de La Laguna (España).
Paradigma, 38(1), 48–71.
Pérez, K., & Orozco, E. (2011). Embarazo en estudiantes de carreras universitarias. Dictamen
Libre, 8(8), 68–72. Retrieved from file:///C:/Users/User/Downloads/475-Texto del
artículo-1832-1-10-20160330 (1).pdf
Portilla Chaves, M., Rojas Zapata, A. F., & Hernández Arteaga, I. (2014). Investigación
cualitativa una reflexión desde la educación como hecho social. Docencia Investigación
Innovación, 3, 86–100.
Presser Carne, C. (2009). Data mining. 1–11.
Quintero, G., & Martín-landrove, M. (2019). Análisis de la Difusión y Curtosis Aparentes en
Imágenes por Resonancia Magnética.
Ramírez, P. E., & Grandón, E. E. (2018). Predicción de la Deserción Académica en una
Universidad Pública Chilena a través de la Clasificación basada en Árboles de Decisión
con Parámetros Optimizados. Formación Universitaria, 11(3), 3–10.
https://doi.org/10.4067/s0718-50062018000300003
Rodríguez Baños, J. (2017). Simpatía, resentimiento y perdón: un análisis del rol del
resentimiento en la tms de Adam Smith. Universitas Philosophica, 34(68), 197.
https://doi.org/10.11144/javeriana.uph34-68.srps
Rodríguez, V., & Chica, M. (2012). Clasificación de imágenes de satélite mediante software
libre : Nuevas tendencias en algoritmos de Inteligencia Artificial. XV Congreso Nacional
de Tecnologías de La Información Geográfica, Madrid, AGE-CSIC, 19-21 de
Septiembre de 2012, 19–21.
Ruiz, R., Garcia, J., & Pérez, M. (2014). Causas y consecuencias de la deserción escolar en el
bachillerato: caso Universidad Autónoma de Sinaloa. Revista de Investigación
Educativa, 10(5), 51–74.
Ruiz Reina, J. L. (2018). Evaluación de modelos.
Salas Picón, W. M. (2015). Revisión sobre la definición del bullying. Poiésis, (30), 44–50.
Retrieved from http://repository.ucc.edu.co/bitstream/ucc/965/1/1858-7309-2-PB.pdf
Salcedo, A., Ramírez, T., & Díaz, R. (2017). ¿Abandono o Deserción estudiantil? Una
necesaria discusión conceptual. Investigación y Postgrado, 32(1), 63–74.
Saldaña Villa, M., & Barriga, O. A. (2010). Adaptación del modelo de deserción universitaria
de Tinto a la Universidad Católica de la Santísima Concepción, Chile. Revista de
Ciencias Sociales(RCS), 16(4), 616–628. Retrieved from
https://www.redalyc.org/html/280/28016613005/
Santos Sharpe, A., & Carli, S. (2016). Estudios globales y locales sobre el abandono de los
85
Jonathan.pdf?sequence=1
Vidal González, M. (2014). El uso del Perceptrón Multicapa para la clasificación de
patrones en conductas adictivas. Universitat de les Illes Balears.
Vieira, M. (2017). ¿Cómo ingresar a la Universidad en Ecuador? - Adipiscor.
Villalobos, C., Alvarez, I., & Vaquera Elizabeth. (2017). Amistades Co-Étnicas e Inter-Éticas
en la adolescencia: Diferencias en la calidad, conflicto y resolucion de problemas. 113–
135. https://doi.org/10.5944/educXX1.1
Villanueva Morales, J. R., Lugo Rodríguez, J. J., Ramírez Buenrostro, D. O., & Ramírez
Pérez, N. V. (2015). Aplicación de algoritmos de clasificación para el análisis de tejido
mamario y detección de cáncer de mama. Pistas Educativas, (114), 260–271.
Viteri Castro, D. A., & Uquillas Narváez, M. A. (2011). Estudio sobre la deserción
estudiantil en la Pontificia Universidad Católica del Ecuador. Retrieved from
http://repositorio.puce.edu.ec/bitstream/handle/22000/3454/T-PUCE-
3398.pdf?sequence=1
Vizcaino Garzón, P. A. (2008). Aplicación de técnicas de inducción de árboles de decisión a
problemas de clasificación mediante el uso de WEKA (Waikato Environment for
Knowledge Analysis). Universidad Nacional de Colombia.
Weka. (2019). SMO.
Yepes Delgado, F. L., Salazar Béltran, M., & Ceferino Martínez, E. Y. (2017). Deserción
Estudiantil en el Pregrado de la Facultad de Odontología de la Universidad de
Antioquia 2004-20141. 29, 76–95.
Zaballa Pardo, M. (2016). Técnicas de machine learning para la detección de la negación en
textos clínicos en español. Universidad Politécnica de Madrid.
Zavala-Guirado, M. A., Álvarez, M., Vázquez, M., Gonzáles, I., & Bazan Ramírez, A. (2018).
Factores internos, externos y bilaterales asociados con la deserción en estudiantes
universitarios. Interacciones, 4(1), 59–69. https://doi.org/10.24016/2018.v4n1.103
87
15 ANEXOS
Anexo 1: Hoja de vida del grupo de trabajo
DATOS PERSONALES
Nombres y Apellidos: Mayra Susana Albán Taipe
Documento de identidad: 050231198-8
Fecha de Nacimiento: 6 julio de 1977
Edad: 43 años
Estado Civil: Soltera
Ciudad de Domicilio: Latacunga
Dirección: Av. José María Velazco Ibarra y pasaje Carlos Aroche Minotola
Teléfono celular: 0987773341
Email institucional: mayra.alban@utc.edu.ec
Tipo de discapacidad: Ninguno
ESTUDIOS REALIZADOS Y TÍTULOS OBTENIDOS
Ingeniera en Informática y
TERCER 2005-01-13 1020-05-554410
Sistemas Computacionales.
AUTORAS
Nombres y Apellidos: Jhenny Flor Masabanda Yépez
Documento de identidad: 050354752-3
Fecha de Nacimiento: 26 de julio de 1995
Lugar de Nacimiento: Moraspungo, Ecuador
Edad: 23 años
Estado Civil: Soltera
Ciudad de Domicilio: Latacunga
Dirección: Sector Mayorista, Latacunga
Celular: 0991569241
Correo Electrónico: jhenny.masabanda3@utc.edu.ec
ESTUDIOS PRIMARIOS:
Escuela Fiscal Mixta “Gabriela Mistral”
Moraspungo – Ecuador
ESTUDIOS SECUNDARIOS:
Unidad Educativa “Moraspungo”
Moraspungo – Ecuador
ESTUDIOS SUPERIORES:
Universidad Técnica de Cotopaxi
Actualmente cursando Décimo semestre de Ingeniería en Informática y Sistemas
Computacionales
Latacunga – Ecuador
89
AUTORAS
Nombres y Apellidos: Carla Jhoana Zapata Rocha
Documento de identidad: 050453900-8
Fecha de Nacimiento: 25 de octubre de 1996
Lugar de Nacimiento: Latacunga, Ecuador
Edad: 22 años
Estado Civil: Soltera
Ciudad de Domicilio: Latacunga
Dirección: Joseguango Bajo
Celular: 0987590924
Correo Electrónico: carla.zapata8@utc.edu.ec
ESTUDIOS PRIMARIOS:
Jardín de Infantes María Montessori
Latacunga – Ecuador
Unidad Educativa Particular “La Inmaculada”
Latacunga – Ecuador
ESTUDIOS SECUNDARIOS:
Colegio de Bachillerato “Primero de Abril”
Latacunga – Ecuador
ESTUDIOS SUPERIORES:
Universidad Técnica de Cotopaxi
Actualmente cursando Décimo semestre de Ingeniería en Informática y Sistemas
Computacionales
Latacunga – Ecuador
90
Anexo 2: Encuesta
ENCUESTA PARA DETERMINAR FACTORES QUE INCIDEN EN LA DESERCIÓN
ESTUDIANTIL UNIVERSITARIA
La presente encuesta permitirá descubrir los Factores que afectan a la Deserción Estudiantil
Universitaria. Esta encuesta está dirigida a las personas que tengan experiencia en temas relacionados
con la deserción en las universidades y sus respuestas serán utilizadas estrictamente con fines de
investigación. La encuesta está dividida en tres secciones. La sección 1 está relacionada con la
caracterización de las instituciones y de la persona que llena el cuestionario. La sección 2 corresponde
a preguntas que determinan la influencia de los factores que inciden en la deserción, y la sección 3
contiene preguntas que complementan al estudio.
Sección 1: Información General
1. Cédula/Pasaporte
………………………………………………..
2. Género
Masculino ( )
Femenino ( )
3. Edad
…………………………………………………….
4. Carrera en la que usted estudia
Sistemas de información ( )
Industrial ( )
Electromecánica ( )
Electricidad ( )
5. Ciclo al que pertenece
Primero ( )
Segundo ( )
Tercero ( )
Cuarto ( )
Quinto ( )
Sexto ( )
Séptimo ( )
Octavo ( )
Noveno ( )
Décimo ( )
6. Estado civil
Soltero/a ( )
Casado/a ( )
Divorciado/a ( )
91
Unión libre ( )
Viudo/a ( )
7. Etnia
Mestizo(a) ( )
Indígena ( )
Afroecuatoriano(a) ( )
Blanco(a) ( )
Mulato(a) ( )
Otro ……………………………………………………………………………………
8. ¿Posee algún tipo de discapacidad?
Si ( )
No ( )
Si su respuesta es sí conteste las siguientes preguntas.
9. ¿Qué tipo de discapacidad presenta?
………………………………………………..
10. ¿Qué grado de discapacidad posee?
………………………………………………..
11. ¿Qué porcentaje de discapacidad (%) posee?
………………………………………………..
12. ¿Qué número carné de CONADIS tiene?
………………………………………………..
13. País de Origen
………………………………………………..
14. Lugar de procedencia
………………………………………………..
15. Lugar de residencia actual
………………………………………………..
16. Estatus social
Baja ( )
Media ( )
Alta ( )
17. Vive cerca de su universidad
Si ( )
No ( )
92
Ninguno ( )
25. ¿Cuál es el nivel de formación de la madre?
Centro alfabetización ( )
Educación básica ( )
Educación media ( )
Superior universitaria completa ( )
Superior universitaria incompleta ( )
Posgrado maestría ( )
Ninguno ( )
26. ¿Seleccione el tipo de colegio del que procede?
Fiscal ( )
Municipal ( )
Particular ( )
Fiscomisional ( )
Otro………………………………………………………………………………………………………
….
Sección 2: Factores de Deserción
En esta sección se presentan preguntas relacionadas a los factores que pueden influir en la deserción de
los estudiantes en las universidades.
Conteste las preguntas con sí o no, de acuerdo al grado de aceptación.
27. ¿Usted eligió la carrera que estudia en base a?
Elección vocacional ( )
El sistema de ingreso a la universidad le asignó esta carrera ( )
Porque no tenía otra opción ( )
28. ¿Considera usted, que su proceso de formación académica está preparándolo para insertarse en
el campo laboral después de graduarse?
Sí ( )
No ( )
29. ¿Completar el proceso de nivelación recibido en la universidad le ayudó en la formación
académica de primer año?
Sí ( )
No ( )
30. ¿La carrera que usted cursa en este momento llena sus expectativas al ser la carrera que usted
deseaba estudiar?
Sí ( )
94
No ( )
31. ¿La universidad en la que estudia actualmente es la institución en la que usted quería estudiar?
Sí ( )
No ( )
32. ¿Considera usted, que el comportamiento negativo del docente en el aula de clases influye en la
decisión de los estudiantes de abandonar la universidad?
Sí ( )
No ( )
33. ¿Ha sentido usted, alguna vez deseos de conducta inapropiada o respuestas emocionales
inapropiadas para con sus docentes?
Si ( )
No ( )
34. Si su respuesta es sí, indique las
razones…………………………………………………………………………………………
……….
35. ¿Considera usted, que el no contar con amistades dentro del aula influye en la decisión del
estudiante de desertar de la universidad?
Sí ( )
No ( )
36. ¿Considera usted, que los espacios de bienestar estudiantil son los adecuados para cubrir las
necesidades de los estudiantes?
Si ( )
No ( )
37. ¿Ha sido usted víctima de discriminación o bullying por parte de sus compañeros?
Sí ( )
No ( )
38. ¿Ha sido usted víctima de discriminación o bullying por parte de sus docentes?
Sí ( )
No ( )
39. ¿Las expectativas profesionales que tiene planeadas a futuro son aceptadas por su familia?
Sí ( )
No ( )
40. ¿Ha pensado usted en algún momento en abandonar la universidad?
Sí ( )
No ( )
95
Alta influencia ( )
Influye totalmente ( )
48. ¿Cuál es el grado de influencia que tiene una inadecuada orientación del aprendizaje con la
deserción estudiantil universitaria?
No influye ( )
Baja influencia ( )
Mediana influencia ( )
Alta influencia ( )
Influye totalmente ( )
49. ¿Considera usted, que un inadecuado desarrollo de las cualidades humanas del docente en el
aula de clases puede influir en la deserción estudiantil?
No influye ( )
Baja influencia ( )
Mediana influencia ( )
Alta influencia ( )
Influye totalmente ( )
50. ¿Considera usted, que un limitado conocimiento para la utilización de tecnologías
especializadas de su carrera influye negativamente en los estudiantes de abandonar la
universidad?
No influye ( )
Baja influencia ( )
Mediana influencia ( )
Alta influencia ( )
Influye totalmente ( )
51. ¿Considera usted, que el embarazo planificado – no planificado influye en la decisión de los
estudiantes de abandonar la universidad?
Planificado
No
planificado
52. ¿Cuál es el nivel de influencia que tiene el número de hijos de los estudiantes con la deserción
estudiantil universitaria?
Entre 1 y 2 hijos
97
Entre 2 y 3 hijos
Más de 3 hijos
53. ¿Cuál es el nivel de influencia que tienen los grupos que componen la comunidad universitaria
respecto al factor BULLYING, con la deserción estudiantil universitaria?
Bullying de
estudiante a
estudiante
Bullying de
docente a
estudiante
54. ¿El limitado conocimiento de la asignatura por parte del estudiante influye en su necesidad de
desertar?
No influye ( )
Baja influencia ( )
Mediana influencia ( )
Alta influencia ( )
Influye totalmente ( )
Sección 3: Factores Varios
55. ¿Cuánto tiempo a la semana les dedica a las siguientes actividades?
Problemas económicos ( )
Problemas sentimentales ( )
Dificultades en el aprendizaje ( )
Problemas de rendimiento académico ( )
No se siente motivado con sus estudios ( )
Falta de apoyo familiar ( )
Grandes cargas de trabajo académico ( )
Problemas de adaptación con sus compañeros ( )
Problemas de salud ( )
Incapacidad para construir o mantener relaciones interpersonales con sus compañeros ( )
Ansiedad ( )
Timidez ( )
Decaimiento ( )
Depresión ( )
Soledad ( )
Ninguna de las anteriores ( )
Otros
Si usted contesto otros, indique cuáles
son:………………………………………………………………………………………………………
…..
58. De los siguientes factores indique ¿Cuáles se relacionan con usted en su etapa de formación
académica?
Déficit de procesamiento de información ( )
Incapacidad para mantener la atención ( )
Hiperactividad ( )
Bajo autoestima ( )
Dificultad para expresar los sentimientos ( )
Rechazo por parte de sus compañeros por su bajo rendimiento ( )
Rechazo por parte de sus docentes por su bajo rendimiento ( )
Ninguna de las anteriores ( )
Otros
Si usted contesto otros, indique cuáles
son:………………………..…………………………………..…………………………………………
………
59. ¿Qué estado de ánimo presenta usted en relación con el docente en el aula de clases?
Nerviosismo ( )
99
Tensión ( )
Preocupación ( )
Temor ( )
Ansiedad ( )
Satisfacción ( )
Alegría ( )
Comodidad ( )
Ninguna de las anteriores ( )
Otros
Si usted contesto otros, indique cuáles
son:…………………..……………..……………………………………………………………………
………
2. Género
20%
80%
En la pregunta número 2, respecto al género de los estudiantes el porcentaje con mayor índice
corresponde a masculino con el 80%, mientras tanto el 20% corresponde a femenino. Según el
autor (Mosteiro García, 1997), menciona que el género femenino opta por estudiar carreras
profesionales identificadas con el rol tradicional de la mujer tales como: Educación Social,
Enfermería, Diplomado en Relaciones Laborales, entre otras, por tal razón se considera que las
mujeres optan por estudiar en Facultades y Escuelas no técnicas, mientras tanto cabe mencionar
que el mayor porcentaje de estudiantes que cursan las carreras técnicas pertenece al género
masculino debido a que muestran una alta autoeficacia en relación a ocupaciones tradicionales
y no tradicionales.
3. Edad
70,0% 63,1%
60,0%
50,0%
40,0%
27,2%
30,0%
20,0%
8,9%
10,0% 0,8%
0,0%
Respuestas
Entre 17-20 años Entre 21-25 años Entre 26-30 años Entre 31-40 años
Según los datos de la encuesta se puede determinar que las edades comprendidas entre (17 a 20
años) existen 397 estudiantes que corresponden al 27%, entre las edades de (21 a 25 años) 919
estudiantes que corresponde al 63%, entre las edades de (27 a 30 años) 130 estudiantes que
corresponde al 9% y entre las edades de (31 a 40 años) 11 estudiantes que corresponde al 1%.
Mediante la revisión de la literatura el autor (Contreras, Caballero, Palacio, & Perez, 2008),
manifiesta que entre las edades comprendidas de (17 a 22 años), corresponde a la adolescencia
y a la etapa del adulto joven, lo que significa que en los primeros años de universidad la
población universitaria en su mayoría son adolescentes, como bien lo define la psicología
evolutiva.
20%
31%
25%
24%
Según los resultados de la encuesta se puede notar que la carrera que más ha aportado al proceso
de investigación pertenece a Sistemas de información con un 31% que corresponde a 449
estudiantes, sin embargo, también se puede considerar que la carrera que menores datos ha
aportado fue Electromecánica con un 20% que corresponde a 297 estudiantes.
102
2%
10% 17%
14% 8%
8%
12%
7%
13% 9%
6. Estado civil
100% 94%
90%
80%
70%
60%
50%
40%
30%
20%
10% 3% 0,14% 3% 0,07%
0%
Respuestas
De 1457 encuestados se puede determinar que el 94% de los estudiantes son solteros, el 3%
corresponde a casados y unión libre y las tasas con menor porcentaje pertenece a divorciados y
viudos. Cabe mencionar que los estudiantes que son casados poseen mayor riesgo de deserción,
puesto que tienen más responsabilidades con su familia ya que muchas de las veces tienen que
elegir entre la universidad y su familia.
7. Etnia
100,00% 94,72%
90,00%
80,00%
70,00%
60,00%
50,00%
40,00%
30,00%
20,00%
10,00% 3,57%
0,69% 0,69% 0,34%
0,00%
Respuestas
Las sociedades latinoamericanas se han caracterizado por una herencia común. Desde la colonia
se tipificaron a los seres humanos en castas, por ejemplo, indios, mestizos, mulatos, entre otros
(Ministerio Coordinador de Patrimonio, 2015). Por tal razón según los resultados de la encuesta
aplicada la mayoría de los estudiantes se consideran mestizos con el 95% que corresponde a
1380 alumnos, no obstante, se puede visualizar a 52 personas que conciernen al 4% se
consideran como población indígena y el 1% como afroecuatoriano y blanco.
104
120%
99%
100%
80%
60%
40%
20%
1%
0%
Respuestas
Si No
120,00%
99,04%
100,00%
80,00%
60,00%
40,00%
20,00%
0,34% 0,21% 0,14% 0,27%
0,00%
Respuestas
Según la encuesta realizada existe un alto índice de discapacidad auditiva con el 0,34% seguida
del habla o lenguaje con el 0,27%, además presenta el 0,21% de discapacidad visual y el 0,14%
de discapacidad física dando como resultado un total de 14 estudiantes que poseen algún tipo
de discapacidad.
120,00%
99,04%
100,00%
80,00%
60,00%
40,00%
20,00%
0,62% 0,34%
0,00%
Respuetas
Según los datos recopilados el 0,62% que pertenece a 9 estudiantes poseen un grado de
discapacidad medio, el 0,34% que corresponde a 5 personas tienen un alto grado de
discapacidad.
120,00%
99,04%
100,00%
80,00%
60,00%
40,00%
20,00%
0,34% 0,14% 0,21% 0,27%
0,00%
Respuestas
Con la aplicación de la encuesta se constató que las respuestas obtenidas a la población aplicada,
un 0,34% mencionaron que poseen un grado de discapacidad de (1% a 20%), el 0,14 posee un
grado de discapacidad entre (21% a 35%), el 0,21 se encuentra entre (36% a 45%) y el 0,27%
respondieron que tienen un grado de discapacidad superior al 46%.
120%
99%
100%
80%
60%
40%
20%
1%
0%
Respuestas
Número Ninguno
120,00%
99,31%
100,00%
80,00%
60,00%
40,00%
20,00%
0,48% 0,07% 0,14%
0,00%
Respuesta
Mediante los datos obtenidos de la pregunta 13, se puede evidenciar que el 99,31% de la
población que corresponde a 1447 estudiantes son de nacionalidad ecuatoriana mientras que el
0,48% son de nacionalidad colombiana, el 0,07% son de nacional española y el 0,14%
pertenecen a la nacionalidad venezolana.
50,0%
42,1%
40,0%
30,0% 22,3%
20,0% 14,9%
10,0% 4,1%
0,3% 0,6%3,0% 0,3%0,3%0,3%0,3%0,6%0,8%0,6%0,8%0,8%1,9% 0,3%2,2%
3,0%
0,3%0,3%
0,0%
Resultados
Según los datos extraídos de la encuesta se realizó el análisis correspondiente sobre el lugar de
procedencia de los estudiantes por carreras teniendo en primera instancia a Eléctrica en la cual
el mayor índice de estudiantes son de la provincia de Cotopaxi con un 42% que corresponde a
153 estudiantes, seguida del 22% que son de la provincia de Tungurahua es decir 81 personas,
con el 15% de población que pertenece a Pichincha con 54 estudiantes, no obstante existen
índices bajos que provienen de las provincias de Bolívar con un 4%, Chimborazo y Sucumbíos
con el 3%, Pastaza y Santo Domingo de los Tsáchilas con el 2% y con el 1% mencionan que
vienen de las provincias de Cañar, Imbabura, Loja, Los Ríos, Napo y Orellana.
108
50,0% 43,4%
40,0%
30,0% 26,4%
20,0% 17,2%
10,0%
0,3%0,3%1,1%0,9% 0,3%0,9%0,3%0,3%0,3%0,9%0,3%0,3%0,9%0,9%2,0% 1,1%0,9% 0,6%0,3%0,3%
0,0%
Resultados
45,0% 42,1%
40,0%
35,0%
30,0% 26,3%
25,0%
20,0% 15,5%
15,0%
10,0%
3,4%
5,0% 0,7% 0,3% 1,7% 0,3% 0,3% 0,3% 1,0% 0,7% 1,7% 0,7% 0,7% 0,7% 1,3% 1,7% 0,3% 0,3%
0,0%
Resultados
50,0% 46,3%
40,0%
31,2%
30,0%
20,0%
8,7%
10,0%
0,2%0,9%0,4%0,2% 0,2%0,4%0,2%1,1%0,4%1,1%0,4%0,2%0,7%1,8%1,6%0,9% 1,6%0,4% 0,4%0,4%
0,0%
Resultados
Mientras tanto la carrera de Sistemas de información posee estudiantes que en su mayoría son
de la provincia de Cotopaxi 208 que corresponde al 46%, en segunda instancia la provincia de
Pichincha con 140 que pertenece al 31% luego la provincia de Tungurahua con 39 que hace
referencia al 9%, no obstante también cuenta con estudiantes que provienen de la provincia de
Pastaza con el 2%, Carchi, Chimborazo, Esmeraldas, Loja, Napo, Orellana, Santo Domingo de
los Tsáchilas, Sucumbíos y el País de Colombia con el 1%.
111
80,0%
70,2%
70,0%
60,0%
50,0%
40,0%
30,0%
20,0% 15,7%
13,2%
10,0%
0,3% 0,3% 0,3%
0,0%
Resultados
Según los datos extraídos de la encuesta se realizó el análisis correspondiente sobre el lugar de
residencia actual de la comunidad estudiantil universitaria por carreras en la que Eléctrica
cuenta con alumnos que viven en la provincia de Cotopaxi generalmente en los Cantones
Latacunga, Salcedo y Pujilí con un 70% que pertenece a 255 estudiantes, seguida por la
provincia de Tungurahua comúnmente de los cantones Ambato, Baños y Pillaro con un 16%
que corresponde a 57, también se encuentra la provincia de Pichincha por lo regular en los
cantones Quito, Mejia y Rumiñahui con 13% que se refiere a 48 estudiantes.
80%
69%
70%
60%
50%
40%
30%
18%
20% 14%
10%
0%
Resultados
70,0% 64,6%
60,0%
50,0%
40,0%
30,0%
20,9%
20,0%
12,8%
10,0%
0,3% 0,3% 0,3% 0,7%
0,0%
Resultados
80,0%
68,8%
70,0%
60,0%
50,0%
40,0%
30,0% 24,1%
20,0%
10,0% 6,7%
0,2% 0,2%
0,0%
Resultados
Mientras tanto la carrera de Sistemas de información posee estudiantes que en su mayoría son
de la provincia de Cotopaxi 309 que corresponde al 69% por lo general en los cantones
Latacunga, Saquisilí, Pujilí, Salcedo y Sigchos, en segunda instancia la provincia de Pichincha
con 108 que pertenece al 24% en los cantones Quito, Rumiñahui y Mejía, luego la provincia de
Tungurahua con 30 que hace referencia al 7% en los cantones Ambato y Pillaro.
90%
80%
80%
70%
60%
50%
40%
30%
19%
20%
10%
1%
0%
Una de las variables asociadas a la deserción es el factor económico que impide la continuidad
del desertor en la Universidad (Páramo & Correa, 1999). Como se muestra en la interrogante
16, se puede mencionar que el 80% de la población estudiantil universitaria menciona que
pertenece a un estatus medio, 19% representa a un estatus social bajo mientras tanto que el 1%
de la población estudiantil universitaria se considera pertenecer a un estatus alto.
Si No
32%
68%
4%
18%
8%
71%
Con la aplicación de la encuesta se puede afirmar que el 71% del tipo de hogar de los estudiantes
está conformada por (padre, madre y hermanos), el 18% se encuentra integrada por (madre y
hermanos), mientras que el 8% está constituida por (otros familiares) y el 4% por (cónyuge e
hijos). Cabe mencionar que los núcleos familiares que se encuentran integradas por otros
familiares y personas ajenas a la familia como por ejemplo madrastras, padrastros, entre otros,
influyen de manera directa en la deserción (Yepes Delgado et al., 2017).
80%
70% 67%
60%
50%
40%
32%
30%
20%
10%
1%
0%
Con respecto al núcleo familiar de los estudiantes se puede constatar que el 67% corresponde a
(1 y 5 miembros), el 32% entre (6 y 10 miembros), mientras tanto el 1% se encuentra compuesta
por (11 y 16 miembros).
80% 73%
70%
60%
50%
40%
30% 23%
20%
10% 2%
1% 1%
0%
En base a las resultantes de la pregunta 20, con respecto al tipo de vivienda en que reside el
estudiante se obtiene que el 73% posee una casa propia, mientras tanto el 23% afirmaron que
arriendan, por otro lado, el 2% mencionaron que es cedida y el 1% ente hipotecada u otra.
90%
81%
80%
70%
60%
50%
40%
30%
20%
12%
10% 6%
1%
0%
Con los resultados de las encuestas se puede afirmar que el 81% de la población estudiantil no
tiene un trabajo por tal razón no generan ingresos económicos, el 12% menciona que posee un
ingreso entre ($1 y $500), mientras tanto el 6% tiene un ingreso entre ($501 y $1000), sin
embargo el 1% de la población manifiesta que cuenta con un ingreso neto mensual superior a
($1000) tomado en consideración que los ingresos antes mencionados corresponden a la familia
del estudiante. Los ingresos familiares mensuales influyen en la deserción, debido a que el padre
y la madre de familia no cuentan con ingresos económicos suficientes que permitan subsanar
los gastos educativos de sus hijos o hijas.
80,00% 74,61%
60,00%
40,00%
21,55%
20,00%
1,17% 0,27% 0,21% 0,89% 1,30%
0,00%
Respuestas
Al analizar los datos generados se puede visualizar que el 74,61% del origen de los recursos de
estudio depende de los padres tutores, el 21,5% son recursos propios obtenidos por el
estudiante, por otro lado, el 1,17% depende de los hermanos y el 1,3% de la pareja sentimental
u otros.
118
23. Si seleccionó recursos propios, conteste la siguiente pregunta. ¿Cuántas horas al día le
dedica al trabajo?
80% 72%
70%
60%
50%
40%
30%
20% 12%
7% 7%
10% 2%
0%
Mediante los resultados obtenidos en la pregunta 23, el 12% representa a estudiantes que
laboran los fines de semana, el 7% afirma que trabajan entre (1 a 4 horas) o entre (4 a 8 horas)
diarias y 2% trabaja más de 8 horas.
50% 47%
40% 33%
30%
20%
10% 6% 6%
4%
2% 1%
0%
En base a los resultados plasmados en la Figura de barras se puede establecer que un 47% de la
población universitaria afirma que el grado de formación de sus padres es educación básica, el
33% menciona que posee educación media, el 6% mencionan que tienen una instrucción
superior completa e incompleta sin embargo los bajos índices representan a los centros de
119
50% 47%
45%
40%
35% 32%
30%
25%
20%
15%
10% 7%
4% 5%
5% 1% 3%
0%
90%
82%
80%
70%
60%
50%
40%
30%
20%
11%
10% 4%
2% 1%
0%
Los resultados de la encuesta manifiesta que el 82% de los estudiantes afirmaron que provienen
de instituciones fiscales siendo este el mayor porcentaje y el 11% menciona que culminaron sus
estudios en una entidad particular, el 4% y 2% en unidades educativas fisco-misional y
municipales respectivamente.
Elección vocacional
El sistema de ingreso a la universidad le asignó esta carrera
Porque no tenía otra opción
9%
32%
59%
Con respecto a esta interrogante el 59% de la población universitaria afirma que la carrera que
está cursando la seleccionaron por elección vocacional, mientras que el 32% por el sistema de
ingreso a la universidad y el 9% porque no tenían opción.
28. ¿Considera usted, que su proceso de formación académica está preparándolo para insertarse
en el campo laboral después de graduarse?
Si No
16%
84%
Si No
26%
74%
Según los resultados de la encuesta el 74% de la población universitaria que comprende 1076
estudiantes manifestaron que el haber recibido nivelación le ayudó en la formación académica
de primer semestre, sin embargo, el 26% que corresponde a 381 alumnos mencionaron que el
proceso de nivelación recibido no contribuyó en el desarrollo académico, no obstante se debe
tener en cuenta que en algunos casos los estudiantes respondieron que no aportó en la formación
académica puesto que fueron exonerados de éste proceso.
30. ¿La carrera que usted cursa en este momento llena sus expectativas al ser la carrera que
usted deseaba estudiar?
Si No
19%
81%
Uno de los factores que puede influir en la deserción, es la mala elección de la carrera, es decir
hace referencia al proceso de admisión, donde, por ejemplo, la falta de información adecuada
y veraz del programa académico y de la institución al estudiante puede conducir a su deserción
(Fontalvo Cerpa et al., 2015). Por otro lado, en los resultados de la encuesta se puede manifestar
que el 81% de la comunidad estudiantil universitaria se siente satisfecho con la carrera que
cursa actualmente, mientras tanto el 19% no se siente conforme con la misma lo cual puede ser
una limitante para continuar con sus estudios.
31. ¿La universidad en la que estudia actualmente es la institución en la que usted quería
estudiar?
Figura 64: Expectativas de la carrera
Si No
41%
59%
De acuerdo a los datos obtenidos en la encuesta se pudo determinar que la mayoría de los
estudiantes que corresponde a un 59% no querían estudiar en la universidad que actualmente se
encuentran pues hubieran querido ingresar en otras universidades que existen en el país siendo
su mayoría universidades públicas, pues solo los que tiene una posibilidad económica ingresan
a universidades privadas, mientras que un 41% de estudiantes deseaban estudiar en la
Universidad Técnica de Cotopaxi.
124
32. ¿Considera usted, que el comportamiento negativo del docente en el aula de clases influye
en la decisión de los estudiantes de abandonar la universidad?
Si No
17%
83%
El factor comportamiento está ligada a la actitud y cuando existe más presión del tiempo pude
elevarse este vínculo que generé este tipo de comportamiento (Edel, 2003). Por tal razón, la
mayoría de los estudiantes que son un 83% consideran que el comportamiento negativo que un
docente puede tener en el aula de clases respecto con sus alumnos genera que los mismos
estudiantes piensen en abandonar sus estudios universitarios y un porcentaje mínimo que
corresponde al 17% piensa que no es así.
33. ¿Ha sentido usted, alguna vez deseos de conducta inapropiada o respuestas emocionales
inapropiadas para con sus docentes?
Si No
16%
84%
Uno de los motivos para que exista conductas inapropiadas es la injusticia la misma que se da
por el resentimiento o la venganza que puede existir hacia una persona, además que no soportan
la conducta de aquella persona a la que tiene resentimiento (Rodríguez Baños, 2017). Por otra
parte, las encuestas que se realizaron en su mayoría los estudiantes no han sentido deseos de
conducta inapropiada o respuestas negativas para con los docentes que imparten sus
conocimientos con los alumnos, esto corresponde a un 84% de las respuestas mientras que un
16% piensa lo contrario por diversas razones.
100% 85,40%
80%
60%
40%
20% 5%
2% 3,60% 2% 2%
0%
Respuestas
En base a la pregunta 33 y de acuerdo a las respuestas, existen diversas razones y motivos que
han hecho sentir a los alumnos deseos de conducta inapropiada para con los docentes entre ellas
se encuentra la prepotencia, autoridad, injustas calificaciones, exceso de tareas todo esto
corresponde a un 2% que es una mínima parte, mientras que un 3,6% es porque no enseñan y
un mayor porcentaje de 5% que es por la actitud que presenta el docente en el aula de clases.
126
34. ¿Considera usted, que el no contar con amistades dentro del aula influye en la decisión
del estudiante de desertar de la universidad?
Si No
48%
52%
Contar con una amistad te mantiene positivo, mejorar tu autoestima, bienestar psicológico y
permite desarrollar la personalidad además del crecimiento socioeconómico (Villalobos,
Alvarez, & Vaquera Elizabeth, 2017). Sin embargo, la mayoría de los estudiantes piensan que
el no tener amistades dentro de la universidad para compartir no incide en que una persona que
está cursando sus estudios académicos abandone la universidad esto corresponde a un 52%,
mientas que un 48 % piensa lo contario.
35. ¿Considera usted, que los espacios de bienestar estudiantil son los adecuados para cubrir
las necesidades de los estudiantes?
Si No
42%
58%
36. ¿Ha sido víctima de discriminación o bullying por parte de sus compañeros?
Si No
9%
91%
De acuerdo a los datos obtenidos a partir de la encuesta la mayoría de los estudiantes no han
sufrido bullying por parte de sus compañeros, lo que corresponde a un 91% y una minina parte
que es un 9% de los alumnos han sido víctima de discriminación por parte de sus compañeros,
lo cual puede influir en la decisión de abandonar los estudios. Por tal motivo, el bullying puede
ser de tipo física o verbal que se repiten, logrando que la víctima se angustie y se encuentre en
poder del acosador, con el uso de tecnologías existe más formas de bullying (Unicef, 2010).
38.- ¿Ha sido víctima de discriminación o bullying por parte de sus docentes?
128
Si No
8%
92%
39. ¿Las expectativas profesionales que tiene planeadas a futuro son aceptadas por su familia?
Figura 72: Expectativas profesionales planeadas
Si No
6%
94%
La mayor parte de los estudiantes afirman que los planes profesionales o las metas trazadas que
tienen planeadas a futuro son aceptados por su familia, lo cual es equivalente a un 94% de
129
respuestas y una pequeña parte del 6% de los planes no son aprobados por la familia del alumno
por tal razón dichos estudiantes pueden estar en riesgo de desertar.
Si No
28%
72%
La deserción se presenta en todos los niveles de universidad, pues son los estudiantes de más
bajos recursos que renuncian a tener un título, la mayoría de los abandonos se da por
circunstancias que obligan a dejar sus estudios (Salcedo, Ramírez, & Díaz, 2017). Según los
datos de la encuesta un 72% de los estudiantes no han pensado en abandonar sus estudios
universitarios pese a las dificultades que se les presente y un 28% de los alumnos han
considerado en dejar la universidad.
80,00% 73,40%
60,00%
40,00%
20,00% 13,10% 8,30%
5,20%
0,00%
Respuestas
En base a la pregunta 40 se pude determinar que existen diversos motivos y causas que han
hecho pensar a los estudiantes en dejar sus estudios académicos, siendo la forma de enseñar y
porque no les gusto la carrera el de menor porcentaje 5,2% de respuestas, un 8,3% son por
razones personales que tiene cada alumno, por problemas familiares y económicos un 13,1%
que representa el porcentaje mayor de las razones expuestas.
1% 7%
2%
30%
60%
120,00%
98,30%
100,00%
80,00%
60,00%
40,00%
20,00%
0,62% 0,40% 0,21%
0,00%
Respuestas
44. ¿Considera usted, que sus profesores valoran su esfuerzo y trabajo en el aula de clases?
Figura 77: Valoran el esfuerzo los docentes
3% 6%
20% 17%
54%
Según las respuestas un alto porcentaje de estudiantes piensan que sus docentes valoran el
esfuerzo que realizan en diversas actividades propuestas que se pueden dar en el aula de clase,
así como fuera de la misma, esto corresponde a un 54% de una mediana valoración, el 20%
considera una alta valoración, el 3% piensa que existe una baja valoración y un 6% de alumnos
consideran que no valoran el esfuerzo que realizan los estudiantes.
8%
16%
19%
17%
40%
De acuerdo a los datos obtenidos por los estudiantes un 40% que es equivalente a una mediana
influencia manifestó que un inadecuado sistema de tutorías por parte de los docentes influye
para que los alumnos decidan no continuar con sus estudios superiores y un 8% piensa que
influye totalmente en la decisión de abandonar la universidad. Pues las tutorías académicas
deben encontrarse en una organización que conlleva planificar, ejecutar, verificar y actuar para
la toma de experiencias con el fin de obtener resultados que tengan beneficios.(Correa Peralta,
Vinueza Martí-nez, Torres Arias, & Ponce Intriago, 2019)
133
46. ¿Considera usted, que los problemas familiares influyen negativamente en la decisión de
abandonar la universidad?
6%
22% 7%
29%
36%
Los problemas familiares afectan a la formación de los estudiantes, pues la familia es el núcleo
de la sociedad en la cual se fortalece o debilitan los deseos de estudiar (Pastrana, Guitiérrez, &
Mendoza, 2018) por tal motivo, de los encuestados un 36% correspondiente a una alta
influencia respondieron que los problemas familiares que llega a tener un estudiante pueden
afectar a continuar con sus estudios académicos, mientras que un 6% que es equivalente a la
minoría de respuestas manifestó que no influye en la decisión de abandonar las aulas
universitarias.
47. ¿Cuál es el grado de influencia que tiene una inadecuada formación académica del docente
con la deserción estudiantil universitaria?
13% 5%
9%
31%
42%
48. ¿Cuál es el grado de influencia que tiene una inadecuada orientación del aprendizaje con la
deserción estudiantil universitaria?
9% 3%
9%
31%
48%
La dificultad de aprendizaje están ligados a los trastornos de una lesión cerebral de tipo
psicológico que impide el desempeño intelectual y la capacidad para adquirir nuevos
conocimientos (Campos & Vargas, 2009). Con los datos obtenidos de los estudiantes se puede
describir que un 48% de las respuestas creen que cuando no existe una orientación que este
acorde al aprendizaje para los estudiantes, lo que corresponde a que sea una media influencia
para los alumnos que tomen la decisión de no continuar con su carrera profesional y un 3%
manifiesta que no influye ni afecta al estudiante.
135
49. ¿Considera usted, que un inadecuado desarrollo de las cualidades humanas del docente en
el aula de clases puede influir en la deserción estudiantil?
10% 4%
12%
27%
47%
8% 9%
22% 18%
43%
35,00%
30,60% 29,40% 29,50%
30,00% 26,10% 27,10%
23,60%
25,00%
20,00%
15,00% 11,10%
8,70% 8%
10,00%
5,80%
5,00%
0,00%
No Influye Baja Influencia Mediana Influencia Alta Influencia Influye Totalmente
Planificado No Planificado
Según los datos obtenidos la mayoría de los estudiantes, un 43% consideran que el embarazo
planificado, no influye en la decisión de desertar mientras que un 5,8% cree que influye
totalmente en dicha decisión, por el contrario, una estudiante al no planificar su embarazo
influye totalmente en la decisión de abandonar sus estudios lo que corresponde a un 29,5% de
las respuestas. Pues el embarazo no deseado lleva a una serie de responsabilidades, ya que a
cierta edad los estudiantes no se sienten preparados para estos cambios, además de la crisis
económica personal o de pareja. La consecuencia del embarazo no deseado conlleva a
interrumpir sus estudios universitarios y empezar a trabajar para tener recursos económicos (K.
Pérez & Orozco, 2011).
137
52. ¿Cuál es el nivel de influencia que tiene el número de hijos de los estudiantes con la
deserción estudiantil universitaria?
45,00% 41%
40,00%
35,00% 31,50% 30,30%
29,40% 28,60%
30,00%
25,00% 21,30%
20,40%
20,00% 17,60% 18,10%
15%
15,00% 11,80%
9,30% 9,70%
10,00% 8% 8%
5,00%
0,00%
No Influye Baja Influencia Mediana Influencia Alta Influencia Influye Totalmente
Mediante la encuesta aplicada a los estudiantes se pudo constatar que un 43% de respuetsas
considera que influye totalmente en un alumno no continuar con su carrera profesional al tener
más de 3 hijos, pues existe mayor responsabilidad, mientras que es de mediana influencia el
tener entre 2 y 3 hijos lo que corresponde a un 30,3% de igual manera que entre 1 y 2 hijos que
es un equivalente a 31,5% ya que en algunos casos no tienen con quien dejar a sus hijos para
que los cuide mientras sus madres estudian.
138
53. ¿Cuál es el nivel de influencia que tienen los grupos que componen la comunidad
universitaria respecto al factor BULLYING, con la deserción estudiantil universitaria?
40,00%
33,70%
35,00%
30,00% 26,30% 26,60%
25,00%
19,80% 20,90% 20,70%
20,00% 16,50%
14,30%
15,00% 11,90%
9,20%
10,00%
5,00%
0,00%
No Influye Baja Influencia Mediana Influencia Alta Influencia Influye Totalmente
De acuerdo a los datos que se obtuvieron existe un alto índice de que el bullying puede existir
entre estudiante a estudiante con un porcentaje de 33,7% y bullying que puede darse entre un
docente a estudiante correspondiente a un 26,6% , los mismos que son considerados como
mediana influencia esto puede ser una causa para que los estudiantes abandonen la universidad,
mientras que un 14,3% y 11,9% de las respuestas que se puede dar entre los grupos ya
mencionados manifiestan que no tiene influencia en la decisión de desertar
54. ¿El limitado conocimiento de la asignatura por parte del estudiante influye en su
necesidad de desertar?
13% 5%
10%
31%
41%
120,00%
100,00%
80,00%
60,00%
40,00%
20,00%
0,00%
0 horas Entre 5-10 horas Entre 10-15 horas Entre 15-20 horas Entre 20-25 horas Más de 25 horas
De acuerdo a los resultados obtenidos de las encuestas aplicadas, la mayoría de los alumnos no
se dedican a actividades que puedan afectar a su salud así el 95% de estudiantes no consumen
drogas, el 74,4% no se dedica a juegos de azar y el 68,8% no consumen bebidas alcohólicas,
mientras que entre 5 a 10 horas existe un 63,1% de estudiantes que están inmersos en las redes
sociales y el 42,1% se dedican a los videojuegos por otro lado existe un considerable grupo de
alumnos que están dedicados al deporte con un 51,2%.
140
0%
0%
12%
88%
La mayoría de los estudiantes que están cursando actualmente sus estudios en el periodo
académico 2019, no tienen hijos lo que indica que existe un alto porcentaje que corresponde a
un 88% de estudiantes sin ningún tipo de responsabilidad de ser padres, mientras que un 12%
de los alumnos manifestaron que tienen entre 1 y 2 hijos a los que deben cuidar, pero no es una
limitante para continuar con sus estudios universitarios.
141
57. De los siguientes ítems ¿Cuál de estos se relaciona con su estado emocional actual que
imposibiliten continuar con sus estudios universitarios?
45,00%
39,70%
40,00%
35,00%
30,00%
24,20%
25,00% 21,70%
20,00% 16,90%
14,30% 13,70%
15,00% 12,60% 12,10% 11,60%
8,40% 8,90% 7,50% 8,30% 7,50%
10,00% 6%
3,20% 3,10%
5,00% 1,50%
0,00%
Respuestas
Mediante las encuestas aplicadas existen diferentes factores que impiden actualmente a los
estudiantes continuar con sus estudios académicos, pues se obtuvieron datos en los que los
principales factores escogidos por los alumnos son el 39% correspondiente a problemas
económicos, el 24,2% no cuenta con el conocimiento previo para comprender el contenido de
ciertas asignaturas y un 21,7% considera que la timidez puede afectar para que abandonen la
carrera que se encuentran estudiando.
142
58. De los siguientes factores indique ¿Cuáles se relacionan con usted en su etapa de
formación académica?
Figura 91: Factores relacionados con la etapa académica
60,00%
50%
50,00%
40,00%
30,00%
18,80%
20,00% 13,40%
12,60%
8% 9,10%
10,00% 6,50%
2,50% 0,61%
0,00%
Respuestas
De acuerdo a la encuesta aplicada, se pudo determinar que los factores que se relacionan con la
etapa de formación académica, que los estudiantes consideran como factores principales son el
déficit para procesar información con un 18,8% de respuestas, un 13,4% tienen problemas para
expresar los sentimientos y un 12% que tiene dificultades para mantener la atención en clases,
mientras que por otro lado, un alto porcentaje del 50% de alumnos consideran que de los
posibles factores planteados ninguno les afecta.
143
59. ¿Qué estado de ánimo presenta usted en relación con el docente en el aula de clases?
Figura 92: Estado de ánimo frente al docente
35,00%
30,60%
30,00%
25,00% 22,60%
19,80% 20,70%
20,00%
14,60% 14,80%
15,00%
10,80% 10,30%
10,00% 8,10%
5,00%
0,82%
0,00%
Respuestas