MODELO PROBABILÍSTICO DE TÓPICOS E ESTATÍSTICA MULTIVARIADA APLICADOS À ANÁLISE TEXTUAL: um módulo de detecção de conversas fora do contexto para analisar conversas em grupo
AVA, Text Mining, LDA, PCA
Ambiente Virtual de Aprendizagem (AVA) é um sistema que proporciona a distribuição e o desenvolvimento de conteúdos diversos para cursos online e disciplinas semipresenciais para alunos em geral. Como um AVA é um ambiente virtual desenvolvido para ajudar professores e tutores no gerenciamento de conteúdos e materiais complementares para os seus alunos e na gestão completa de cursos online, é imprescindível que esse gerenciamento esteja relacionado ao que os alunos realmente discutem diante de um tema proposto à discussão. A dinâmica de discussão sobre um tema proposto cria uma enorme quantidade de dados na forma de texto, dificultando a tarefa de extrair conhecimento sobre as informações relacionadas. Visando minorar esta dificuldade, este trabalho faz uso da mineração de texto, por meio de duas técnicas tradicionais da estatística multivariada, LDA (do inglês, Latent Dirichlet Allocation) e PCA (do inglês, Principal Components Analysis), buscando verificar a eficiência e análise exploratória a fim de reportar a importância estatística dos termos analisados nos textos. Consegue-se, com este trabalho, não apenas realizar a redução da dimensão dos dados, como também a categorização, de modo automático, de documentos que estão na forma de dados textuais.