Banca de QUALIFICAÇÃO: LUCAS BRUNO FERNANDES PRAXEDES

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : LUCAS BRUNO FERNANDES PRAXEDES
DATA : 27/05/2026
HORA: 15:30
LOCAL: Videoconferência via Google Meet
TÍTULO:

Uso de Variáveis Exógenas para a Modelagem Preditiva de Demandas de Matrículas Escolares: Um Estudo de Caso no Brasil


PALAVRAS-CHAVES:

Predição de Matrículas. Aprendizado de Máquina. Variáveis Exógenas. Validação Temporal. Inteligência Artificial Explicável.


PÁGINAS: 54
RESUMO:

A previsão do número de matrículas escolares é uma informação relevante para o planejamento educacional e para decisões associadas à distribuição de recursos públicos. No contexto do Fundo Nacional de Desenvolvimento da Educação (FNDE), estimativas imprecisas podem afetar a definição de quantitativos utilizados em políticas e programas educacionais, inclusive aqueles relacionados à aquisição e distribuição de materiais didáticos. Parte dessa dificuldade decorre do uso de projeções baseadas predominantemente em séries históricas e ajustes incrementais, que tendem a representar de forma limitada mudanças territoriais, variações demográficas, eventos climáticos e outros fatores externos ao Censo Escolar. Diante desse problema, este trabalho tem como objetivo avaliar a contribuição de variáveis exógenas para uma tarefa de regressão voltada à predição do número de matrículas escolares na educação básica brasileira. A pesquisa compara modelos de referência com algoritmos de Aprendizagem de Máquina (do inglês, Machine Learning), buscando verificar em que condições variáveis externas aos microdados do Censo Escolar contribuem para reduzir erros preditivos e produzir estimativas úteis como insumo ao planejamento público. Metodologicamente, estruturou-se um pipeline de integração de dados que combina os microdados do INEP aos registros meteorológicos do INMET e aos relatórios de calamidade do S2iD, preservando a possibilidade de incorporação de outras bases exógenas ao processo analítico. A predição foi conduzida por uma estrutura do tipo Voting Ensemble, composta por algoritmos de Gradient Boosting (XGBoost e LightGBM) processados em GPU. Para reduzir o risco de Data Leakage e aproximar a avaliação das condições reais de previsão, aplicou-se validação cruzada temporal (Walk-Forward). A interpretabilidade dos modelos foi analisada por técnicas de Inteligência Artificial Explicável, com uso de valores SHAP. Os resultados indicam que os modelos baseados em Gradient Boosting apresentaram desempenho superior ao baseline linear nas métricas avaliadas, com redução dos erros preditivos em diferentes etapas de ensino. Observou-se também que a validação temporal produz estimativas de desempenho mais conservadoras do que partições aleatórias, especialmente em séries com maior instabilidade. Conclui-se que a incorporação de variáveis exógenas pode complementar os dados educacionais tradicionais e apoiar previsões de matrículas mais contextualizadas, auditáveis e compatíveis com a heterogeneidade territorial brasileira.


MEMBROS DA BANCA:
Presidente - 2303300 - LENARDO CHAVES E SILVA
Interno - ***.691.924-** - SEBASTIÃO EMIDIO ALVES FILHO - UERN
Externo à Instituição - RAFAEL DE AMORIM SILVA
Externo à Instituição - BRUNO ALMEIDA PIMENTEL
Notícia cadastrada em: 21/05/2026 15:25
SIGAA | Superintendência de Tecnologia da Informação e Comunicação - (84) 3317-8210 | Copyright © 2006-2026 - UFRN - sig-prd-sigaa02.sigaa02