Registro:
Documento: | Tesis de Grado |
Título: | Análisis exploratorio y estadístico sobre el alumnado de Ciencias de la Computación en FCEN-UBA |
Autor: | Paz, Daniel; Varaschin, Nicolás |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la web: | 2025-06-12 |
Fecha de defensa: | 2016 |
Fecha en portada: | 2016 |
Grado Obtenido: | Grado |
Título Obtenido: | Licenciado en Ciencias de la Computación |
Departamento Docente: | Departamento de Computación |
Director: | Diuk Wasser, Carlos Gregorio |
Director Asistente: | Fernández Slezak, Diego |
Jurado: | Mislej, Ernesto Marcelo; Schapachnik, Fernando Pablo |
Idioma: | Español |
Palabras clave: | ANALISIS EXPLORATORIO DE DATOS; INFERENCIA ESTADISTICA; MACHINE LEARNING; RANDOM FORESTS; GRADIENT BOOSTINGEXPLORATORY DATA ANALYSIS; STATISTICAL INFERENCE; MACHINE LEARNING; RANDOM FORESTS; GRADIENT BOOSTING |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/seminario_nCOM000649_PazVaraschin |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000649_PazVaraschin.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/seminario/document/seminario_nCOM000649_PazVaraschin |
Ubicación: | Dep.COM 000649 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Paz, Daniel; Varaschin, Nicolás. (2016). Análisis exploratorio y estadístico sobre el alumnado de Ciencias de la Computación en FCEN-UBA. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de http://hdl.handle.net/20.500.12110/seminario_nCOM000649_PazVaraschin |
Resumen:
Actualmente en la Argentina existen diversas carreras enfocadas en la tecnología, informática y computación. La cantidad de profesionales informáticos que forman dichas carreras no alcanza a satisfacer la demanda del mercado laboral. Dada la gran demanda actual en temas computacionales, conocer nuevos datos acerca de los alumnos actuales y graduados de la carrera de Ciencias de la Computación de FCEN puede aportar información valiosa sobre la problemática general. Otro problema de importancia es la baja proporción de mujeres en el alumnado. En la actualidad, saber las causas de por qué las mujeres no eligen una carrera de computación es de interés para muchos centros de estudios del mundo entero. En el presente trabajo recolectamos los datos necesarios, los analizamos estadísticamente y obtenemos conclusiones para tratar el problema de descubrir los factores que afectan al rendimiento académico y a la deserción de los alumnos. Dentro del análisis pretendemos poder predecir si, dado un alumno, este presenta tendencia a tener un rendimiento académico bajo o alto. Asimismo, poder analizar los factores que indican la regularidad de un alumno o futura falta de ella tanto si abandona la carrera como si se gradúa. Dentro de la investigación esperamos poder generar un perfil de los alumnos actuales del departamento y sus graduados. Dimos especial énfasis a determinar los factores de interés de las mujeres sobre nuestra carrera. Los resultados obtenidos proveen información útil sobre preguntas clásicas y creencias típicas del alumnado. Se encontró evidencia que indica que no son necesarios conocimientos previos de programación antes de ingresar a la carrera para tener éxito en la misma. Los datos reafirman que el hecho de realizar los ejercicios de las guías prácticas influye positivamente en los alumnos logrando que un porcentaje menor de estos postergue la carrera. En nuestra carrera se suele pensar que el examen final de la materia An´alisis II se posterga hacia el final de la misma. Sin embargo, en otro análisis realizado en este trabajo se observó que, en promedio, dicho examen se rinde en la fecha acorde al plan de estudios. A pesar de esto, los alumnos suelen postergar los exámenes finales de materias como Métodos Numéricos, Organización del Computador II e Ingeniería del Software II. Los datos ponen en descubierto que las fechas acordadas por el plan de estudios son difíciles de cumplir por la mayoría del alumnado. En este sentido, se analizaron cuáles materias son las más postergadas. El contexto de la tesis se enmarca en la obtención y procesamiento de datos del alumnado. Dichos datos se obtuvieron mediante encuestas diseñadas por nosotros y a través de datos provistos por el Departamento de Alumnos de la Facultad. Los grupos a analizar comprenden tanto a los alumnos regulares como a los graduados. Utilizando los datos, se construyó un método predictivo para poder inferir si un alumno es propenso a postergar o no la carrera. Se consideraron modelos de Regresión Generalizada y modelos de clasificación propios del área de Machine Learning (Random Forests y Gradient Boosting). Dentro de los predictores más influyentes del clasificador encontramos el hecho de utilizar Internet para el estudio, las horas que trabaja el alumno, si consideró dejar la carrera alguna vez, si mantuvo un mismo grupo de trabajos prácticos durante varias materias y si tuvo o no alguna beca. Analizando a los alumnos que quedaron libres, se descubrió que más de la mitad abandona la carrera sin aprobar ningún final y, en segunda instancia, se abandona luego de rendir Análisis II o 2 Álgebra (primeras dos materias del plan de estudios). Complementando el trabajo, se realizó un estudio sobre el grupo de alumnas de nuestra carrera. El objetivo fue sumar información a la tendencia en estudios acerca de mujeres en el sector informático. Se recolectaron algunas características que son elegidas por la mayor´ıa de las alumnas para elegir nuestra carrera. Se destaca el interés desde el secundario por las matemáticas y la computación. En cuanto al rendimiento académico, el mayor factor que afecta a este grupo en particular es el hecho de trabajar y estudiar a la vez.
Abstract:
Currently in Argentina there are multiple bachelor and master degrees focused in technology, informatics and computer science. The amount of professionals graduated from those schools are not enough to satisfy the market’s demand. Given the current big demand in computational orientations, it is relevant to gather and study new data about the undergraduate and graduate students from the Computer Science Department at FCEN-UBA. Another issue of importance relies on the low proportion of female students within the student body. Knowing the causes that drive the female students not to choose a degree in Computer Science, is of interest to many study centers worldwide. The following work gathers the necessary data, performs statistical analyses and acquires new insights to deal with the problem of learning which factors impact the academic performance and desertion. With our analysis we pretend to be able to predict if given a student, he or she shows an inclination of having a good or bad academic performance. Furthermore, we will analyze which features suggest the regularity of a student, or a future lack of regularity given that the student abandoned or finished the degree. With our research we hope to produce a profile for the current and graduated students. We will be giving special attention to determine the factors of interest for women in our degree. Results obtained provide feasible information about common questions and common beliefs that students have. Evidence was found that supports that it’s not necessary to be successful in this particular career no previous programming knowledge is necessary . Data reaffirms that completing the optional exercises and handouts provided by each course (as it’s always suggested) is very influential over students, achieving a lower percentage of them to delay the obtention of their degree. It’s a common belief of students from our career that the final exam of Calculus II it’s delayed until near the end of the career. However, another analysis performed we observed that this final exam is , in average, taken on the planned date stupilated by the career syllabus. Nevertheless, final exams from courses like Numerical Methods, Computer Organization II and Software Engineering II are usually delayed by students. Data obtained shed light that dates proposed by the carrer syllabus are hard to accomplish for the majority of the student body. Following this line of thought, we analysed which courses are the most delayed by students. The context of our thesis focuses on obtaining and processing of students data. This information was obtained from surveys and data provided by the students department. The groups to be analyzed were composed by the general student body and graduated students. Using this data, we built a predictive model to be able to infer if a student is likely to delay the career or not. We considered Generalized Regression models and other models belonging to the area of machine learning (Random Forests and Gradient Boosting). Within the most influential predictors we found the fact of student using internet to complement his/her study, if he/she kept a common study group throughout several courses and if he/she has a scholarship. Analyzing the dropout students, we discovered that more than half of them give up the career without passing any final exam and, secondly, the students drop out after passing Caluculus II or Algebra (first two subjects of the career syllabus). To complement our work, we performed a study over the female students of our career. The objective was to add information to the already existing studies about women in computer science. Some features that are chosen by 4 the majority of the female students at the moment to choose our career were gathered. We highlight the interest for mathematics and computer subjects in high school. Regarding the academic performance, the biggest factor that affects this group in particular, is the fact of working and studying at the same time.
Citación:
---------- APA ----------
Paz, Daniel; Varaschin, Nicolás. (2016). Análisis exploratorio y estadístico sobre el alumnado de Ciencias de la Computación en FCEN-UBA. (Tesis de Grado. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/seminario_nCOM000649_PazVaraschin
---------- CHICAGO ----------
Paz, Daniel; Varaschin, Nicolás. "Análisis exploratorio y estadístico sobre el alumnado de Ciencias de la Computación en FCEN-UBA". Tesis de Grado, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2016.https://hdl.handle.net/20.500.12110/seminario_nCOM000649_PazVaraschin
Estadísticas:
Descargas mensuales
Total de descargas desde :
https://bibliotecadigital.exactas.uba.ar/download/seminario/seminario_nCOM000649_PazVaraschin.pdf
Distrubución geográfica