• Flickr Governo de São Paulo
  • Linkedin Governo de São Paulo
  • TikTok Governo de São Paulo
  • Twitter Governo de São Paulo
  • Youtube Governo de São Paulo
  • Instagram Governo de São Paulo
  • Facebook Governo de São Paulo
  • /governosp

Análise e utilização da aprendizagem de máquina em dados de alunos e ex-alunos do ensino superior para obtenção das causas e entendimento sobre a evasão escolar em instituições de ensino

Resumo

Apesar de ter discussões aprofundadas no ensino fundamental e médio, os índices de evasão carecem de discussão aprofundada no ensino superior. Entender os fatores que levam a evasão escolar pode trazer luz ao problema, com esse entendimento é possível propor ações que sejam eficientes, otimizando recursos. Uma forma de tentar entender quais são esses fatores é a avaliação de correlação sobre os atributos que descrevem os alunos e suas características, posteriormente aplicando esses dados dentro de um algoritmo de máquina não supervisionado. Algoritmos não-supervisionados são baseados em encontrar padrões dentro de um conjunto de dados, sem a necessidade de fazer o processo de rotulação ou predição, sendo assim, na nossa perspectiva, a ideia é encontrar quais atributos de uma pessoa são essenciais para definir se essa pessoa irá evadir ou não. Pensando nisso, este trabalho busca por meio da aprendizagem de máquina, encontrar características relevantes, ou até possíveis causas para a evasão de alunos no ensino superior. Para isso foram utilizados microdados do censo da educação superior do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) de 2019, onde foram aplicados métodos de aprendizado não supervisionado, mais precisamente K-Means, Expectation-Maximization e DBSCAN. Os resultados do trabalho demonstram precisão de 93.60% e uma acurácia 34.78%, além de prover vários indicativos de possíveis causas e soluções.
Despite having in-depth discussions in elementary and secondary education, dropout rates lack in-depth discussion in higher education. Understanding the factors that lead to school dropouts can shed light on the problem, with this understanding it is possible to propose actions that are efficient, optimizing resources. One way to try to understand what these factors are is to evaluate correlations on the attributes that describe students and their characteristics, later applying this data within an unsupervised machine learning algorithm. Unsupervised algorithms are based on finding patterns within a dataset, without the need to do the labeling or prediction process, so, from our perspective, the idea is to find which attributes of a person are essential to define whether this person will evade or not. With that in mind, this work seeks, through machine learning, to find relevant characteristics, or even possible causes for the dropout of students in higher education. For this, microdata from the higher education census of the National Institute of Educational Studies and Research Anísio Teixeira (INEP) of 2019 were used, where unsupervised learning methods were applied, more precisely K-Means, Expectation-Maximization and DBSCAN. The results of the work demonstrate a precision of 93.60% and an accuracy of 34.78%, in addition to providing several indications of possible causes and solutions.

Descrição

Citação

ALMAGRO, Bruno Correia; BRITO, Leonardo Almeida Santos. Análise e utilização da aprendizagem de máquina em dados de alunos e ex-alunos do ensino superior para obtenção das causas e entendimento sobre a evasão escolar em instituições de ensino. 2021. 46 f. Trabalho de conclusão de curso (Curso Superior de Gestão da Tecnologia da Informação) - Fatec Catanduva, Catanduva, 2021.

Avaliação

Revisão

Suplementado Por

Referenciado Por

Governo do Estado de SP